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(54) Titie: NON-M NON-O HIV STOAINS, FRAGMENTS AND APPLICATIONS 
(54) Titre: SOUCHES DE VIH-1 NON-M NON-O. FRAGMENTS ET APPLICATIONS 
(57) Abstract 

Ute invention concerns retroviral strains of the group HIV-1, non-M 
non-O, particularly a strain called YBF30, its ^gments and its applications as 
diagnosis reagent and as immunogenic agent. The HIV-2 different both firom 
the group M and from the group O have the following characteristics: little or 
no serological response wilh respect to proteins of groups M and O and strong 
serological response with respect to proteins derived from die YBF30 strain or 
the SIV CPZGAB strain; absence of genomic amplification by the primers of 
regions env and gag of the HIV-I-1 of groups M and O; genomic amplification 
in the presence of die primers derived from die YBF30 stram; and homology 
of die envelope gene products higgler than 70 % witti respect to the YBF30 
strain. 

(57) Abr^^ 

Souchcs de r6trovirus du groupe VIH-1. non-M non-0, notamment 
une souche d6iomm€e YBF30, ses figments ainsi que ses applications, en 
tant que rtfactif de diagnostic et en tant qu'agent immunogfcne. Lcs VIH-1 
distincts la fois du groupe M et du groupe O pr^sentent les caract^ristiques 
suivantes: pen ou pas de r^activit^ sdrologique vis-^vis des protdines des 
groupes M et O et fcHte r6activit£ s^rologique vis-^vis des prot^ines issues 
de la souche YBF30 selon Tinvention ou de la souche SIV CPZGAB; absence 
d*amplification g6nomique ^ Taide des amorces des regions env et gag des 
VIH-1 des groupes M et O; amplification gdnomique en presence des amorces issues de la souche YBF30, selon Tinvention; et homologic 
des produits du gftne d'enveloppe sup6rieme a 70 % vis-^vis de la souche YBF30. 
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Pro Pro Asp Asn Asn Lys Glu Arg Ala His Ser Pro Ala Thr Arg Glu 
20 25 30 

Leu Trp Val Ser Gly Gly Glu Glu His Thr Gly Glu Gly Asp Ala Gly 
35 40 45 

Glu Pro Gly Glu Asp Arg Glu Leu Ser Val Pro Thr Phe Asn Phe Pro 
50 55 60 

Gin lie Thr Leu Trp Gin Arg Pro Val lie Thr Val Lys lie Gly Lys 
65 70 75 80 

Glu Val Arg Glu Ala Leu Leu Asp Thr Gly Ala Asp Asp Thr Val lie 
85 90 95 

Glu Glu Leu Gin Leu Glu Gly Lys Trp Lys Pro Lys Met lie Gly Gly 
100 105 110 

lie Gly Gly Phe lie Lys Val Arg Gin Tyr Asp Asn lie Thr Val Asp 
115 120 125 

lie Gin Gly Arg Lys Ala Val Gly Thr Val Leu Val Gly Pro Thr Pro 
130 135 140 

Val Asn He He Gly Arg Asn Leu Leu Thr Gin He Gly Cys Thr Leu 
145 150 155 160 

Asn Phe Pro He Ser Pro He Glu Thr Val Pro Val Lys Leu Lys Pro 
165 170 175 

Gly Met Asp Gly Pro Lys Val Lys Gin Trp Pro Leu Thr Thr Glu Lys 
180 185 190 

He Glu Ala Leu Arg Glu He Cys Thr Glu Met Glu Lys Glu Gly Lys 
195 200 205 

He Ser Arg He Gly Pro Glu Asn Pro Tyr Asn Thr Pro He Phe Ala 
210 215 220 

He Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg 
225 230 235 240 

Glu Leu Asn Lys Arg Thr Gin Asp Phe Trp Glu Val Gin Leu Gly He 
245 250 255 

Pro His Pro Ala Gly Leu Lys Gin Lys Lys Ser Val Thr Val Leu Asp 
260 265 270 

Val Gly Asp Ala Tyr Phe Ser Cys Pro Leu Asp Lys Asp Phe Arg Lys 
275 280 285 

Tyr Thr Ala Phe Thr He Pro Ser He Asn Asn Glu Thr Pro Gly He 
290 295 300 

Arg Tyr Gin Tyr Asn Val Leu Pro Gin Gly Trp Lys Gly Ser Pro Ala 
305 310 315 320 

He Phe Gin Ser Thr Met Thr Lys He Leu Glu Pro Phe Arg Glu Lys 
325 330 335 

His Pro Glu He He He Tyr Gin Tyr Met Asp Asp Leu Tyr Val Gly 
340 345 350 

Ser Asp Leu Glu Leu Ala Gin His Arg Glu Ala Val Glu Asp Leu Arg 
355 360 365 
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SOUCHES DE Vffl-1 NON-M NON-0, FRAGMENTS ET APPLICATIONS 

La presente invention est relative a des souches de retrovirus du 
groupe VIH-1, non-M non-0, notamment une souche denommee YBF30, a ses frag- 
ments ainsi qu'a ses applications, en tant que reactif de diagnostic et en tant qu'agent 
5 immunogene. 

Les virus humains de rimmunodeficience acquise, VIH-1 et VIH-2 
sont des retrolentivirus, virus retrouves chez de nombreux primates africains. Tous ces 
virus semblent avoir un ancetre conmiun ; il est toutefois tres difficile de prejuger de la 
periode a laquelle ces diflferents virus se sont separes de ce precurseur. D'autres virus 
10 plus distants bien que faisant partie du meme groupe sont retrouves chez d'autres 
mammiferes (ongules et felins). 

Tous ces virus sont associes a des infections longues ; Tabsence de 
symptomes est la regie chez les singes infectes naturellement. 

Du fait de sa forte homologie avec le virus du Sooty Mangabey 
15 (Afhque de TOuest), I'origine du VIH-2 semble claire, mais aucun virus proche du 
VIH-1 rfa ete retrouve chez les singes. Les virus les plus proches sont des virus retrou- 
ves chez deux chimpanzes (SIV CPZGAB, SIV ANT). 

Une importante variabilite genetique est retrouvee chez tous les 
lentivirus, et Fetude phylogenetique de ces variants obtenus a partir de nombreux points 
20 geographiques difFerents a permis de distinguer pour VIH-1, 8 sous-types (clades), 
tous egalement equidistants entre eux. Les clades ne sont qu'une representation 
mathematique de Texpression de la variabilite : Tanalyse phenetique, basee non sur les 
acides nucleiques mais sur les acides amines donne des resultats difFerents (Korber et 
al, 1994), 

25 La mise en evidence de sous-types correspond a une analyse phylo- 

genetique qui rfa pas, a ce jour de correlation physiopathologique, mais une correspon- 
dance geographique. En eflfet, chaque sous-type est retrouve principalement dans un 
certain espace geographique. En Europe et aux Etats-Unis, le sous-type B est majori- 
taire, alors qu'en Thailande, deux sous-types E et B sont retrouves, et qu'il existe une 

30 correlation forte entre le mode de transmission qui, en fait, correspond a une certaine 
population et le sous-type retrouve. Tous les clades ont ete retrouves en Afrique et 
leurs distributions a travers le reste du monde reflete une probabilite de rencontre entre 
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personnes a comportement a haut risque. Le clade majoritaire, car present en propor- 
tion importante en Afrique est le clade A. Dans certains pays d'Afrique, une tres grande 
variabilite a ete retrouvee (G. Myers, 1994 ; P.M. Sharp et al., 1994). Plusieurs sous- 
types ont ete caracterises dans les pays d'Afiique centrale de Touest, comme la 
5 Republique Centre Africaine (Murphy et al, 1993) et le Cameroun (Nkengasong et ai, 
1994). 

Demierement, des patients porteurs de virus variants du VIH-1, dont 
les serums posaient des problemes de detection pour certains kits commercialises sur le 
marche franfais et dont les western blots de confirmation etaient atypiques, ont ete 

10 caracterises (Loussert-Ajaka et al ; 1994; Simon et al, 1994 ; Demande Internationale 
PCX WO 96/27013). 

L'analyse de ces variants a permis de confirmer que les virus VIH de 
type 1, devaient etre sous-divises en deux groupes, le groupe M (majeur) et un groupe 
0 (Outlier) incluant ces isolats, comme I'avaient propose Chameau et al, 1994. L'ana- 

15 lyse du rapport des mutations synonymes/mutations non synonymes sur les sequences 
des virus du groupe O coimus, indique que ce nouveau groupe est aussi ancien, si ce 
n'est plus, que le groupe M (Loussert-Ajaka et al, 1995). Sa faible prevalence a ce jour, 
8% des patients infectes par VIH-1 au Cameroun (Zekeng et al, 1994), et 18 cas carac- 
terises en France, serait due a des facteurs purement epidemiologiques. 

20 Ces deux groupes de VEH-l forment un arbre en forme de double 

etoile (figures 9 a 19). Deux isolats, SIV CPZGAB, caracterise a partir d*un chimpanze 
du Gabon (Huet et al, 1990) et CPZANT, caracterise a partir d'un chimpanze du zoo 
d'Anvers ont des sequences et des organisations geniques tres proche de VIH-1, mais 
ne s*inscrivent dans aucun de ces deux groupes et forment sur Tarbre phylogenetique 

25 deux nouvelles branches. 

La mise en evidence de nouveaux variants est importante pour mettre 
au point des reactifs de depistage des infections par VIH, suflBsanmient sensibles et 
specifiques, c'est-a-dire ne conduisant pas a des resultats faussement negatifs ou faus- 
sement positifs et des compositions protectrices vis-a-vis de sous-types n'appartenant 

30 ni au groupe M, ni au groupe O. 

En consequence, la Demanderesse s'est donne pour but de pourvoir a 
une souche non-M, non-0, ainsi qu'a des sequences issues de cette souche, aptes a 
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permettre la detection de variants du VIH-1 non M et non-0, qui permettent d*eviter 
Tobtention de resultats faussement negatifs ou faussement positifs. Pour ce faire, les 
Inventeurs ont notamment etabli un algorithme de differenciation et de confirmation 
entre les infections HTV-l des groupes M et 0, ce qui leur a permis de selectionner des 
5 variants non-M, non-0. 

La presente invention a pour objet une souche de VIH-1 rion-M non- 
O, presentant les caracteristiques morphologiques et immunologiques du retrovirus 
depose a la Collection Nationale de Cultures de Microorganismes tenue par I'lnstitut 
Pasteur sous le numero 1-1753 (denomme YBF30) le 2 juillet 1996. 
10 On entend par variant non-M non-0, un VIH de type 1, qui serologi- 

quement et moleculairement ne peut etre reconnu comme appartenant a Fun de ces 
groupes. 

La presente invention a egalement pour objet la sequence nucleoti- 
dique complete de la souche telle que definie ci-dessus (SEQ ID N^l) ainsi que des 
15 fi-agments d'acide nucleique d'au moins 10 nucleotides, issus de ladite souche. 
Parmi ces fi*agments, on peut citer : 

- LTR YBF 30 (SEQ ID N*»2), 

- GAG YBF 30 (SEQ ID N^3) (gene gag), 
. POL YBF 30 (SEQ ID N°5) (gene pol)^ 

20 - VIF YBF 30 (SEQ ID N°7) (gene vif), 

- VPR YBF 30 (SEQ ID N**9) (gene vpr), 

- VPU YBF 30 (SEQ ID N°ll) (gene vpu\ 

- TAT YBF 30 (SEQ ID N^13) (gene tai\ 
. REV YBF 30 (SEQ ID N°15) (gene rev), 

25 - ENV gpl60 YBF 30 (SEQ ID N°17) (gene ewv), 

- NEF YBF 30 (SEQ ID N^19) (gene mf), 

- les SEQ ID N°21-57, egalement denommees respectivement YLG, 
LPBS.l, GAG Y ASl.l, GAG Y ASl, GAG 6, GAG Y SI, GAG Y Sl.l, GAG Y 
S1.2, YRT ASL3, YRT AS1.2, YRT ASl.l, YRT 2, YRT ASl, YRT 2.1, YRT 2.2, 

30 YRT 2.3, YRT 2.4, 4481-1, 4481-2, 4235.1, 4235.2, 4235.3, 4235.4, SK69.6, 
SK69.5, SK69.4, SK69.3, SK69.2, SK69.1, SK68.1, SK68.2, SK68.3, LSI AS1.3, LSI 
AS1.2, LSI ASl.l, LSI A1,YLPA, ainsi que toute sequence, qui n'est pas identique a 
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Tune des sequences nucleotidiques ci-dessus ou n'est pas complementaire de I'une de 
ces sequences, mais est neanmoins susceptible de s'hybrider, de maniere specifique, 
avec une sequence nucleique issue d'un virus VIH-1 non-M, non-O. 

De telles sequences trouvent application dans Fidentification speci- 
5 fique d'un VIH-1 non-M non-0, comme reactif de diagnostic, seules ou en pool avec 
d'autres reactifs, pour Tidentification dififerentielle de n'importe quel VIH-1. 
Ces sequences peuvent notamment etre mises en oeuvre dans des tests de diagnostic 
coinprenant, soit une hybridation directe avec la sequence virale a detecter, soit une 
amplification de ladite sequence virale, en utilisant comme amorces ou conmie sondes, 

10 un oligonucleotide comprenant au moins 10 nucleotides, inclus dans Tune quelconque 
des sequences ci-dessus et notamment Tune des sequences SEQ ID N^l-57 precitees. 

La presente invention a egalement pour objet des VIH-1, caracterises 
en ce qu'ils sont distincts a la fois du groupe M et du groupe O et presentent les 
caracteristiques suivantes : 

15 * peu ou pas de reactivite serologique vis-a-vis des proteines des 

groupes M et O et forte reactivite serologique vis-a-vis des proteines issues de la 
souche YBF30 ou de la souche SIV CPZGAB ; 

* absence d'amplification genomique a Taide des amorces des 
regions env et gag des VIH- 1 des groupes M et O ; 

20 * amplification genomique en presence des amorces issues de la 

souche YBF30, telles que definies ci-dessus ; et 

* homologie des produits du gene d'enveloppe > 70 % vis-a-vis de la 

souche YBF30. 

LMnvention a egalement pour objet Tutilisation des sequences 
25 decrites ci-dessus pour la mise en oeuvre d'un procede d'hybridation et/ou 
d'amplification genique de sequences nucleiques de type VIH-1, ces precedes etant 
applicables au diagnostic in vitro de I'infection potentielle d*un mdividu par un virus du 
type Vffi-l non-M non-0. 

Ce procede de diagnostic in vitro est realise a partir d'un echantillon 
30 biologique (serum ou lymphocyte drculant) et comprend : 

. une etape d'extraction de Tacide nucleique a detecter, appartenant 
au genome du virus, eventuellement present dans Techantillon biologique et, le cas 
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echeant, une etape de traitement de Tacide nucleique, a I'aide d'une transcriptase inver- 
se, si ce dernier est sous forme d*ARN, 

. au moins un cycle comprenant les etapes de denaturation de I'acide 
nucleique, d'hybridation avec au moins une sequence conforme a Finvention et even- 
tuellement, si necessaire, extension de Thybride forme, en presence de reactifs conve- 
nables (agent de polymerisation, tel qu*ADN polymerase et dNTP) et 

. une etape de detection de la presence eventuelle de Tacide 
nucleique appartenant au genome d'un vims de type VIH-1 de groupe non-M non-0. 

Les conditions mises en oeuvre pour la PCR a Taide des amorces 
issues de la souche YBF30 sont les suivantes : 

- Extraction de TADN lymphocytaire par la technique phenol-chloro- 
fome et quantification par spectrophotometrie a une longueur d'onde de 260 nm. 
Toutes les amplifications sont realisees sur Perkin Elmer thermocycler 2400. 

- Les PCR longues (9 kb) sont realisees avec le kit XL PCR (Perkin 
Elmer) selon les conditions du febriquant et avec les dNTP, les tampons foumis et le 
« hot start » de Perkm Elmer ; les cycles d' amplification de cette PCR longue sont : 

. 1 cycle de denaturation pendant 2 minutes a 94°C, 

. puis 16 cycles : 15 secondes a 94''C, 15 secondes a 55°C, 8 minutes 

a68°C, 

. puis 24 cycles : 15 secondes a 94''C, 15 secondes a 55°C, 8 minutes 
a 68*^C, en ajoutant a chaque cycle 15 secondes de plus (incrementation). 

- Les PCR nichees sont realisees sur les produits d'amplification des 
PCR longues. Les conditions de realisation des PCR nichees sont : 

. tampon et enzyme Taq polymerase « Expand High Fidelity PCR 
System » de Boehringer Mannheim selon les instructions du fabriquant, dNTP et « hot 
start » de Perkin Elmer, 

. 200 jlM de chaque dNTP, 20 pmol de chaque amorce selon 
rinvention, 5 \i\ d'ADN, 10 p.1 de tampon PCR lOX, 2,6 unites de Taq polymerase 
dans un volume de 1 00 

. amplification : un cycle de 2 minutes a 94*'C, suivie de 38 cycles : 
15 secondes a 94''C, 15 secondes a 55*^C, un temps d'elongation a 72°C variable selon 
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la taille du produit de PGR a amplifier (de 30 secondes a 2 minutes) et un dernier cycle 
d*elongation de 10 minutes a 72^C. 

La detection du produit amplifie est realisee de preference par 
sequen^age direct. 

5 L*invention a egalement pour objet un peptide ou un fragment pepti- 

dique, caracterise en ce qu'il est susceptible d'etre exprime par une souche de VIH-1 
non-M non-O ou a Taide d'une sequence nucleotidique telle que definie ci-dessus et en 
ce qu'il est apte : (1) a etre reconnu par des anticorps induits par un VIH-1 non-M 
non-0, tel que defini ci-dessus et notamment la souche YBF30 ou un variant de celle-ci 
10 et presents dans un echantillon biologique obtenu apres une infection par une souche de 
VTH-l non-M non-0 et/ou (2) a induire la production d'anticorps anti-VIH-1 non-M 
non-O. 

Parmi ces peptides, on peut citer, en particulier ceux issus de la 
souche YBF30 et notamment : celui exprime par le gene gag (SEQ ED N** 4). celui 

15 exprime par le gene pol (SEQ ID N° 6), celui exprime par le gene v//(SEQ ID N° 8), 
celui exprime par le gene vpr (SEQ ID N*' 10), celui exprime par le gene vpu (SEQ ID 
12), celui exprime par le gene tat (SEQ ID N° 14), celui exprime par le gene rev 
(SEQ ID N° 16), celui exprime par le gene env (SEQ ID N° 18) ou Tun de ses frag- 
ments, tel qu'un fragment de la region de la boucle V3 

20 CTIU>GNNTGGQVQIGPAMTFYNffiKIVGDIRQAYC (SEQ ID N*^ 58) et celui 
exprime par le gene nef (SEQ ID 20) ou un fragment de ceux-ci aptes a reconnaitre 
les anticorps produits lors d'une infection par un VIH-1 non-M non-0 tel que defini ci- 
dessus. 

L'invention a egalement pour objet des compositions immunogenes 
25 comprenant un ou plusieurs produits de traduction des sequences nucleotidiques selon 
rinvention et/ou Tun des peptides tels que definis ci-dessus, obtenus notanunent de 
maniere synthetique. 

L'invention a egalement pour objet les anticorps diriges contre I'un 
ou plusieurs des peptides decrits ci-dessus et leur utilisation pour la mise en oeuvre de 
30 methodes de diagnostic in vitro^ notamment diflferentielle, de Finfection d'un individu 
par un virus de type VIH-1, selon les precedes connus de Thomme du metier. 
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La presente invention englobe Fensemble des peptides aptes a etre 
reconnus par des anticorps isoles a partir d*un serum infectieux obtenu apres une 
infection par une souche VIH-1 non-M non-0 et les peptides aptes a etre reconnus par 
un anticorps selon Tinvention. 
5 L'invention a, en outre, pour objet une methode de diagnostic in 

vitro d'un VIH-1 non-M non-0, caracterisee en ce qu'elle comprend la mise en contact 
d'un echantillon biologique preleve chez un patient, avec des anticorps selon la reven- 
dication 10, eventuellement associes a des anticorps anti-SIV CPZGAB et la detection 
des complexes inununologiques formes entre les antigenes de VIH-1, eventuellement 
10 presents dans rechantillon biologique et lesdits anticorps. 

L'invention a egalement pour objet une trousse de diagnostic de 
VIH-1, caracterisee en ce qu*elle inclut au moins un reactif selon Finvention. 

Outre les dispositions qui precedent, l'invention comprend encore 
d*autres dispositions, qui ressortiront de la description qui va suivre, qui se refere a des 
15 exemples de mise en oeuvre du procede objet de la presente invention ainsi qu'aux 
dessins annexes, dans lesquels : 

- les figures 1 a 7 illustrent I'emplacement des diflferentes amorces sur 
le genome de la souche YBF30 ; 

- la figure 8 illustre Torganisation genomique de la souche YBF30 ; 
20 - les figures 9 a 16 representent I'analyse phylogenetique des diflfe- 

rents genes de la souche YBF30 par rapport au VIH-1 de groupe M et de groupe O 
(figure 9 : gene Itr^ figure 10 : gene gag^ figure 11 : gene to/, figure 12 : gene rev, 
figure 13 : gene vif, figure 14 : gene em gpl20, figure 15 : gene env gp41, figure 16 : 
gene mf, figure 17 : gene pol, figure 18 : gene vpr, figure 19 : gene vpu) ; 
25 - la figure 20 illustre le pourcentage de distance genetique entre 

YBF30 et VIH-l/SIV CPZGAB. 

II doit etre bien entendu, toutefois, que ces exemples sont donnes 
uniquement a titre d'illustration de T objet de l'invention, dont ils ne constituent en 
aucune maniere une limitation. 
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EXEMPLE : Obtention d'un variant VBB-l non-M non-O selon I'invention 
(YBF30) et ses applications* 

Ceci a en particulier ete possible en etudiant repidemiologie de I'in- 
fection par les virus de I'immunodeficience humaine acquise (VIH) au Cameroun, qui 
5 est particulierement paradoxale. Dans ce pays, la diversite des souches est remarquable, 
puisque la plupart des sous-types connus a ce jour des virus VIH-1 du groupe M 
(Majeur) ont ete rapportes. Des cas ^infections par des virus VIH-1 hautement diver- 
geants du groupe O (O pour outlier) ont ete rapportes, presque exclusivement chez des 
patients d'origine camerounaise. Des cas d'infections par VIH-2, HTLV-1 et HTLV-2 
10 sous-type A et B ont ete egalement rapportes. 

Sur la base des resultats des evaluations serologiques et genotypiques 
anterieures, les Inventeurs ont etabli un algorithme de differenciation et de confirmation 
entre les infections VIH-1 des groupes M et O, afin de selectionner des variants non- 
M, non-O. 

15 Ces methodes ont ete appliquees sur des echantillons adresses au 

Laboratoire National de Reference des infections a VIH de Yaounde et ont permis de 
caracteriser un isolat VIH hautement divergeant et de definir les outils de caracterisa- 
tion d*un nouveau groupe VIH-1, compte tenu des homologies observees entre cette 
souche humaine YBF30 et la souche simienne SIV CPZGAB. 
I - Moyen de caracterisation serologique du variant YBF30 lors dfi Tcti^dQ epideniio- 
lQgiau& 

n Recueil des echantillons : 

Tous les serums de patients adultes adresses au Laboratoire de refe- 
rence de Yaounde en 1994 et 1995 pour depistage ou confirmation d*une infection HTV 
ont ete etudies (n=883 1 ). 

2) Differenciation seroloedque entre VIH-1 groupe M et groupe O et 
selection des variants : 

En cas de positivite du depistage anti-VIH (EIA indirect mixte HIV- 
1 et HIV-2 Genelavia Nfixt, Sanofi-Pasteur, Paris, France), un test EIA base sur le 
principe de la competition vis a vis d'antigene specifique du groupe M (Wellcozyme 
Rec HIV-1, Murex, Dartford, UK), a ete associe. 
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En cas de positivite du test de type competitif Wellcozyme Rec HTV- 
1, avec ratio de reactivite en densite optique (DO) par rapport a la valeur seuil ou cut- 
off (CO) superieur a 5 (CO/DO >5), le serum est considere comme VIH-1 positi^ 
resultat qui doit etre confirme sur un nouveau prelevement. 
5 Le choix d'un ratio de reactivite superieur a 5 pour considerer le test 

par competition comme test de confirmation de I'infection a VIH-1 est base sur Texpe- 
rience acquise par le laboratoire de virologie de ITiopital Bichat : sur 7200 echantillons 
reactifs avec un ratio > 5, tous presentaient un Western Blot VIH-1 (WB, New Lav 
Blot 1, SDP, Mames la Coquette) fortement positif. En dehors des cas de sero- 

10 conversions VIH-1, les echantillons confirmes VIH positifs et presentant un ratio 
Wellcozyme < 5, correspondent soit a des infections par VIH-2, soit a des infections 
par VIH-I du groupe O ou d'autres variants. 

Pour eliminer les reactions faussement positives en depistage EIA 
mixte, les echantillons presentant un ratio CO/DO < 5 sont systematiquement testes par 

15 un EIA mixte HIV-l/HIV-2 de troisieme generation (Enzygnost Plus, Marburg, 
Germany) incluant les antigenes des VIH-1 des groupes M et O (recombinant gp41 de 
la souche MVP5180). En cas de positivite de ce test, un test rapide discriminant HTV-l 
et HrV-2 (Multispot, SDP, Mames la Coquette) et un Western Blot (WB, New Lav 
Blot 1 ou 2, SDP) sont realises. 

20 3) Confirmation serologique des infections VIH-1 groupe O et 

variants . 

Tous les echantillons presentant un ratio CO/DO < 5, difiFerencies 
positifs par WB (criteres de positivite : 2 ENV +/- pOL +/- GAG ou 1 ENV + POL +/- 
GAG) et HTV-l, sont testes par un test Dot-blot utilisant des antigenes peptidiques des 
25 regions V3 et transmembranaires (InnoLia, Innogenetics, Ghent, Belgium). 

4"^ Isolement retroviral des souches de groupe O et des variants. 
Les cellules mononucleees sanguines peripheriques (PBMC) des 
patients seropositifs ont ete isoles par gradient de FicoU-Hypaque au Cameroun, 
conservees et transportees a Paris en azote liquide. 
30 Apres decongelation, les PBMC des patients ont ete cocultives avec 

des lymphocytes de donneurs caucasiens seronegatife. La replication virale dans les 
sumageants de cultures a ete mise en evidence par la detection de I'activite transcrip- 
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tase inverse et par la recherche de I'Antigene p24 (Elavia p24 polyclonal, SDP) sur une 
periode d'un mois. 

5) Sequences : 

Les produits des PCR sont visualises sur gels d'agarose de 1 a 1,4 % 
5 selon la taille des fragments, precipites en acetate de sodium 3M (1:10) et 3 volumes 
d'ethanol absolu, incubes 30 minutes a -80°C, centrifuges 20 minutes a 13 000 rpm. Le 
culot est seche puis repris avec 10 |il d*eau distillee (Sigma). La purification est realisee 
sur « Qiaquick Gel Extraction kit » (Qiagen) selon les instructions du fabriquant ; les 
produits sont sequences avec le Kit Dye Terminator Applied Biosystem sur un auto- 
mate DNA Sequencer (Applied Biosystems, Inc., Foster Cit, CA), comme decrit 
precedemment (Loussert-Ajaka et al, 1995) ; les sequences nucleotidiques sont analy- 
sees sur logiciel Sequence Navigator (Applied Biosystems), alignes avec le logiciel 
GeneWorks (Intelligenetics Inc.). 

6) Analyses phvlogenetiques : 

Les sequences ont ete alignees avec le logiciel CLUSTAL pour les 
alignements multiples, en prenant comme matrice de reference, les alignements de la 
compilation des sequences VIH du laboratoire de Biologie et de Biophysique 
Theorique de Los Alamos, New Mexico, 87545 USA. 

Les analyses phylogenetiques ont ete faites avec le logiciel PHYLIP ; 
dans un premier temps, les distances ont ete calculees avec DNADIST, puis Tanalyse 
phylogenetique a ensuite ete realisee avec NEIGHBOR JOINING ou FITCH ; enfin, 
les arbres ont ete dessines avec DRAWTREE (figures 9 a 19), Les pourcentages de 
distance genetique sont egalement illustres a la figure 20. 

Pour les analyses de « boostrapping », SEQBOOT a d'abord ete uti- 
lise, suivi de DNADIST et NEIGHBOR-JOINING ou FITCH. Enfin les valeurs de 
boostrap ont ete obtenues avec CONSENS. 

TT - RftCTiltat<; dft I'p.nquete de mise en evidence des VTH groupe O et variant : 

174 echantillons, parmi 3193 echantillons positifs au depistage, ont 
ete consideres soit groupe O, soit groupe M avec reactivite serologique anormale, soit 
comme variants. 
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m - Mise en evidence_d'un echantillon non g roupe O et non groupe M presentant une 
reactivite serologique anonnale 

Les 174 serums HTV-l positifs par WB (Western Blot), mais reactifs 
avec un ratio CO/DO < 5 en EIA de type competitif ont ete testes par dot blot LIA de 
5 diflFerenciation sur les peptides V3 du groupe M, groupe O et SIV CPZGAB : 

- 7 ne reagissent sur aucun des peptides (M, O ou SIV CPGGAB) 
representes. L'absence de coliecte cellulaire ne permet aucune conclusion. 

- 82 presentent une reactivite vis a vis d'au moins un des peptides 
correspondant a la boucle V3 des souches du groupe O. La frequence des reactions 

10 croisees est faible et limitee aux epitopes correspondant aux regions V3 consensus 
(1 1 %) et SIV-CPZ GAB (43 %) . 

- 84 serums sont non reactifs vis-a-vis des epitopes du groupe O. Ces 
prelevements ont ete realises majoritairement chez des patients presentant un SDDA 
(75/84). 

15 - un serum, preleve chez une patiente camerounaise (NJ) est reactif 

excliisivement avec le peptide SIV CPZGAB. Cette reactivite isolee vis a vis d*un anti- 
gene du SIV CPZGAB n'a jamais ete decrite auparavant. Des lymphocytes ayant ete 
collectes chez la patiente, la caracterisation virologique de cette souche nommee 
YBF30 a pu etre poursuivie. 

20 IV - Resultats des examens s^rologiques Qt virologiques sur les premiers prelevCTents 

effectues sur cette patiente (mai 1995) CN° serum : 95-6295) : 

1) Tests ELIS A commerciaux (Densite optique/valeur seuil) 
Critere de positivite : DO/CO > 1 

Genelavia = >15 
25 Wellcozyme CO/DO = 1,55 

Abbott Plus = >1 5 
Behring Plus== 4,2 

2) Western blot 

WB Nev/ Lav 1 Pasteur : 
30 160++, 120++, 68++,55+ 41+ 40+/-, 34++, 24++, 18+ 
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3) LIA dot-Blot Innogenetics 

Negatif pour toutes les bandes groupe O et groupe M sauf V3 SIV 

CPZGAB 

4) Resultats des examens serologiques de recherche sur peptides 
5 specifiques des groupes M et O 

* La technique du Pr. Francis Barin du Laboratoire de Virologie du 
CHU de Tours a ete adaptee (Barin F. et al., 1996) ; des peptides des regions trans- 
membranaires synthetises (BioMerieux) on ete utilises, pour mettre au point un test de 
difiTerenciation entre les groupes M et 0. Cette technique est basee sur la competition 
10 de liaison des anticorps entre les peptides transmembranaires gp41 des groupes O et M 
deposes sur la phase solide et des peptides transmembranaires gp41 soit du groupe O, 
soit du groupe M en concentration superieure en une phase liquide de reaction 
hyperosmolaire. Les resultats sont illustres au Tableau I ci-apres, dans lequel le puits 
CP correspond au temoin d'inhibition 100 % et le puits CSP correspond au controle 0 
% d'inhibition. 

Tableau I 



Resultats des differenciations inter groupe O - groupe M du serum 6295 





gp41 M 


gp41 0 


CP 


CSP 


6295 


0,25 


0,36 


0,12 


1,98 



Ces resultats montrent qu'il existe une forte liaison vis-a-vis des pep- 
tides de la phase solide (CSP), une nette inhibition par Tadjonction combinee des pep- 
tides M et O (CP) mais pas de nette difFerenciation, soit par le peptide M, soit par le 
peptide O. D existe done une evidence serologique que la souche infectante n'appartient 
ni au groupe M, ni au groupe O. 

* Compte tenu d*une reactivite isolee sur le dot blot InnoLia vis-a-vis 
des antigenes V3 SIV CPZGAB, sur les memes bases de competition entre peptides, ce 
serum a ete etudie en mettant en competition les peptides gp41 M, gp41 O et gp 41 
SrV CPZGAB. 

Uutilisation du serum du chimpanze denonmie 'Amandine* (donne par 
M. Peeters, qui a isole la souche SIV CPZGAB, AIDS 1992) a permis, dans un pre- 
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mier temps, de valider cette technique, Sur le tableau II, les valeurs (DO) les plus 
basses indiquent le plus haut degre de liaison aux antigenes. 

Tableau n 

Resultats des differenciations inter groupe O - groupe M - SIVcpzGab avec le 



5 serum du chimpanze Amandine et le serum 6295 





gp41 M 


gp41 0 


gp41 
CPZGAB 


CP 


CSP 


Amandine 


0,8 


1.4 


0,3 


0,5 


1,9 


6295 


0,7 


1,1 


0.7 


0,4 


2,1 



La reactivite du serum « Amandine » confirme et valide le test selon 
rinvention et indique que le serum de la patiente reagit de maniere identique vis-a-vis 
des peptides M et SIV CPZGAB, mais est sans reaction croisee avec le peptide O. 
10 Ces resultats montrent qull existe une inhibition similaire avec le 

serum de la patiente par les peptides gp41 du groupe M et gp41 SIV CPZGAB. Les 
antigenes de la souche infectante ont done donne naissance a des anticorps reconnais- 
sant, de fagon similaire, les gp 41 du groupe M et du SIV CPZGAB. 

4) Resultats obtenus a partir de Tisolement lymphocytaire 
15 (prelevement mai 1995) 

Un retrovirus a ete isole a partir des lymphocytes preleves le 22 mai 
1995, selon les techniques classiques. La culture avec la lignee MT2 montre que la 
souche YBF30 ne forme pas de syncytia (NSI). 

V - Resultats des eyamens serologiques ?air le deiiyieme prelevement (Novembre 1995) 
20 (N° serum : 95-3371) 

1) LIA dot-Blot Innogenetics 

Negatif pour toutes les bandes, sauf V3 SIV CPZGAB 

2) Resultats des examens serolo gi ques de recherche sur peptides 
specifiques des groupes M et O. 

25 Le Tableau HI illustre les resultats des diflFerenciations gp41 inter 

groupe O - groupe M - SIV CPZGAB avec le serum 3371 . 
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Tableau m 



Resultats des difTerenciations gp41 inter groupe O - groupe M - 
SIV CPZGAB avec le serum 3371 





fip41 M 


gp410 


gp41 cpz-Rab 


CP 


CSP 


3371 


1,31 


1,7 


0,89 


0.54 


2,02 



5 Ces resultats confirment sur ce nouveau prelevement (eflfectue chez 

la meme patiente, en phase terminale de la maladie) qu'il existe une inhibition marquee 
avec le seaim de la patiente par le peptide gp41 SIV CPZGAB. 

Les antigenes de la souche infectante ont done induit des anticorps 
reconnaissant de fafon preferentielle la gp 41 du SIV CPZGAB. 
10 3) Resultats de Tisolement lymphocytaire (prelevement novembre 95 

(95-3371 -YBF31)) 

Un retrovirus a ete isole a partir des lymphocytes preleves en novem- 
bre 1995, selon les techniques classiques et denomme YBF31 ; les elements de 
sequence sont identiques a ceux de YBF30. 
15 VT - Amplification genomique et Sequences de YBF 30 

L'ADN pour toutes les manipulations de PGR est extrait a partir des 
cellules de fin de culture positive. 

Les PGR realisees avec les amorces VDH-l groupe O dans differentes 
regions testees sont negatives (gag^ pol, env) . De meme, celles realisees avec les 
20 amorces specifiques du VIH-1 groupe M sont negatives. 

Les conditions d'amplification et d'hybridation pour les PCR du 
groupe O sont realisees dans les conditions decrites dans Loussert-Ajaka, 1995. Les 
conditions d'amplification et d*hybridation pour les PCR du groupe M sont celles 
decrites par les Auteurs cites ci-apres. 
25 Ces amorces groupe M sont positionnees selon la sequence HIV-1- 

HXB2: 

- Dans Venv gpl20 ; ED3/ED12 (position 5956-5985 ; 7822-7792) ; 
ED5/ED14 (6556-6581 ; 7960-7931) ; ED5/ED12 ; ED3/ED14 ; ES7/ES8 (7001- 
7020 ; 7667-7647) (Delwart et al. Science 1993; 262 : 1257-1261 ). 
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- Dans Tewv gp41 : premiere PCR ED3/M29, suivie d'une PCR nichee 
M28/M29 (7785-7808 ; 8099-8124) ; M28/M29 presentent les sequences suivantes: 
M28 : CGGTTCTT(AG)GGAGCAGC(ACT)GGAAGCA, 

M29 : T(CT)T(ACGT)TCCCA(CT)T(AT)(CT)A(AGT)CCA(AGT)GTCAT ; 
5 SK68/SK69 (Ou et al. Science, 1988; 239: 295-297). 

- Dans le gag : Amplicor Roche Diagnostics systems ; amorces gag 
nichees (Loussert-Ajaka et al. Lancet 1995; 346: 912-913) ; SK38/SK39 (Ou et al.. 
Science, 1988; 239: 295-297). 

- Dans le pol : A/NEl (Boucher et al.. Lancet, 1990; 336: 585-590) ; 
Pol3/Pol4 (Laure et al., Lancet, 1988, ii, 538-541 ). 

Seules les PCR realisees avec les amorces H Pol sont positives 
(4235/4538) suivie dhane PCR nichee avec les amorces 4327/4481 (Fransen et al. 
Molecular and Cellular Probes 1994; 8: 31 7-322). Ce fragment H Pol, localise dans 
I'integrase (260 pb), a ete sequence. L' amplification avec les amorces HPOL est rendue 
possible, en raison de Fexces de virus. En eflfet, PADN utilise est extrait des cellules de 
fin de culture fortement positive (transcriptase inverse > 100.000 cpm). L'amplification 
de I'ADN extrait des cellules filches sans coculture est impossible de par le nombre 
important de mesappariement entre les amorces HPOL (surtout dans la region 3*) et la 
sequence de Tisolat YBF30. La conservation de cette extremite 3' est tres importante 
pour Tactivite d'extension de la Taq polymerase. 

1 - Sequence du gene pol : Tutilisation d* amorces tres degenerees 
pour l'amplification par RT-PCR du RNA extrait du sumageant de culture positif^ a 
donne une amplification positive. Ce sont des amorces communes a tous les retrovirus 
(Donehower et al. J. Virol Methods 1990; 28; 33-46), situes dans la region de la 
transcriptase inverse du gene pol, L'analyse du fragment apres sequence a permis de 
generer une amorce specifique YRT2 (SEQ ID N° 32) de Vlsolat YBF30 et ^amplifier 
le gene pol en utilisant I'amorce Hpol 4481 (Fransen et al., 1994 precite), comme 
amorce anti-sens. La sequence du fragment a ete realisee en synthetisant au fiir et a 
mesure des amorces specifiques pour chaque fragment genere (Figure 1). 

2 - Sequence du gene env : la deuxieme approche a ete de faire une 
PCR longue (XL-PCR, Perkin Elmer) amplifiant tout le virus (9000 pb) en utilisant des 
amorces situees dans le LTR : LPBS 1 (SEQ ID N^22) ; LSiGi, suiN^ie dWe PCR 
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nichee avec YRT2 (SEQ ID N"* 32)/SK69 de 6000 pb, et de sequencer toute I'enve- 
loppe en suivant la meme procedure. La sequence de la region gp41 a ete realisee en 
utilisant une PCR nichee avec les amorces SK68/LSiGi. 

3 - Sequence du gene gag : utilisation d*une PCR nichee, realisee par 
5 PCR longue (LPBS 1 /LSiGi), avec les amorces Gag 5 et Gag Hi, et en generant au 
fiir et a mesure des amorces specifiques, afin de marcher sur le genome viral. 
Vn - Rftsiilfats Hes sequences 

La souche YBF30 a ete completement sequencee (voir liste des 
sequences). La souche YBF31 de Novembre 1995 a ete partieliement sequencee et 
10 I'absence de variation significative confirme la validite des sequences de YBF30. 
vm - Synthese de peptides de la region de la boucle V3 de la souche YBF3Q. 

L'etude des sequences de la region de la boucle V3 a permis de syn- 
thetiser le peptide correspondant et de comparer les acides amines de cette region de la 
souche YBF 30 avec ceux des autres sous-types M et des souches O, 
15 Les sequences des peptides sont : 

YBF30 : SEQ N° ID 58 

SIV CPZGAB : CHEO^GNNTRGEVQIGPGMTFYNIENVYGDTRSAYC 
(SEQEDN^ 59) 

GROUPE O : CIRPGNRTYRNLQIGPGMTFYNVEIATGDIRKAFC 
20 (ANT70) (SEQ ID N° 60) 

GROUPE M : CTRPlSn^NTRKSVRIGPGQAFYATGDnGDIRQAHC 
(SS-TYPE A) (SEQ ID N° 61) 

Le peptide a ete synthetise, a partir des 2 asparagines de la region 5* 
25 de la boucle et utilise selon le meme principe que decrit precedenunent (voir IV 4)), a 
savoir en competition par rapport aux peptides du groupe M, du groupe O et du SIV 
CPZGAB. Les resultats illustres au Tableau IV confirment Toriginalite de cette souche 
et Textension possible de ces souches puisque les resultats serologiques sont en faveur 
d'infection du type YBF30 au Cameroun. En outre, I'etude de 200 serums selectionnes 
30 VIH-1 positifs du Cameroun met en evidence un nouveau cas presentant un profil 
similaire a celui de YBF30. 
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Tableau IV 
Etude de reactivite de 200 serums 



Serum 


Orieine 


V3A 


V3cpz 


V3YBF30 


CP 


CSP 


953371 


Cameroun 


1,66 


0,38 


1,39 


0,39 


1,64 


956295. 


Cameroun 


1,72 


0.37 


1,16 


0,51 


1,73 


967321 


Cameroun 


0,07 


0,17 


0,5 


0,05 


0,27 


Amandine 


SIVGAB 


1,74 


0,14 


1,48 


0,19 


1,74 


NO A.* 


SIVANT 


2,66 


0,31 


1,88 


0,46 


1.9 


* serum du S 


[V CPZ ANT 



5 Sur ce nouveau test, la reactivite des semms 953371 et 956295, 

correspondant a la patiente chez qui la souche YBF30 a ete isolee, avec le peptide 
SrV-CPZ, a ete confirmee. La plus feible reactivite vis a vis de son propre antigene V3 
est classique lors des stades tardifs de la maladie. Cette reactivite reste cependant supe- 
rieure a celle relevee vis a vis du peptide M. Un autre patient camerounais (serum 
10 96732 1 ) presente le meme profil de reactivite peptidique. 
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Ainsi que cela ressort de ce qui precede, I'invention ne se limite 
nullement a ceux de ses modes de mise en oeuvre, de realisation et d'application qui 
>dennent d'etre decrits de fa?on plus explicite ; elle en embrasse au contraire toutes les 
30 variantes qui peuvent venir a Tesprit du technicien en la matiere, sans s'ecarter du 
cadre, ni de la portee, de la presente invention. 
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LISTE DE SgQTTgNCBS 



(1) INFORMATIONS GENERALES: 

(i) DEPOSANT: 

(A) NOM: INSTITUT NATIONAL DE LA SANTE ET DE LA 

RECHERCHE MEDICALE - INSERM 

(B) RUE: 101 rue de Tolbiac 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75654 CEDEX 13 



(A 
(B 
(C 
(E 
<F 

<A 
(B 
(C 
(E 
(F 

(A 
(B 
(C 
(E 
(F 

(A 
(B 
(C 
(E 
(F 

(A 
(B 
(C 
(E 
(F 

(A 
(B 
(C 
{E 
(F 

(A 
(B 
(C 
(E 
(F 



NOM: ASSISTANCE PUBLIQUE-HOPITAUX DE PARIS 

RUE: 3 avenue Victoria 

VILLE: PARIS 

PAYS: FRANCE 

CODE POSTAL: 75100 RP 

NOM: INSTITUT PASTEUR 
RUE: 28 rue du Docteur Roux 
VILLE: PARIS 
PAYS: FRANCE 

CODE POSTAL: 75724 Cedex 15 

NOM: MAUCLERE Philippe 
RUE: 2 rue Buhan 
VILLE: BORDEAUX 
PAYS: FRANCE 
CODE POSTAL: 33000 

NOM: LOUSSERT-AJAKA Ibtissam 

RUE: 26 avenue de la R^publique 

VILLE: SARTROUVILLE 

PAYS: FRANCE 

CODE POSTAL: 78500 

NOM: SIMON Francois 

RUE: 8 rue Germain Pilon 

VILLE: PARIS 

PAYS: FRANCE 

CODE POSTAL: 75018 

NOM: SARAGOSTI Sentob 

RUE: 69 bis rue de Billancourt 

VILLE: BOULOGNE BILLANCOURT 

PAYS: FRANCE 

CODE POSTAL: 92100 

NOM: BARRE-SINOUSSI FranQoise 

RUE: 104 Le Capricome, 50 rue d* Erevan 

VILLE: ISSY LES MOULINEAUX 

PAYS: FRANCE 

CODE POSTAL: 92130 



(ii) TITRE DE L' INVENTION: SOUCHES DE VTH-l NON-M NON-0, FRAGMENTS ET 

APPLICATIONS. 



(iii) NOMBRE DE SEQUENCES: 61 



wo 98726075 



PCT/FR97ya2227 



20 

(iv) FORME DECHIFFRABLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC cort^atible 

(C) SYSTEME D' EXPLOITATION: PC -DOS /MS -DOS 

(D) LOGICIEL: Patentin Release #1.0, Version #1.30 (OEB) 

(2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 9183 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBflE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 



CTTCTCGCTT 


GTACTGGGTC 


TCTCTTGCTG 


GACCAGATTA 


GAGCCTGGGA 


GCTCTCTGGC 


60 


TAGCAGGGAA 


CCCACTGCTT 


AAGCCTCAAT 


AAAGCTTGCC 


TTGAGTGCTA 


AAGTGGTGTG 


120 


TGCCCATCCA 


TTCGGTAACT 


CTGGTACCTA 


GAGATCCCTC 


AGACCATCTA 


GACTGAGTGA 


180 


AAAATCTCTA 


GCAGTGGCGC 


CCGAACAGGG 


ACTTGAAAAC 


GAAAGTAGAA 


CCGGAGGCTG 


240 


AATCTCTCGA 


CGCAGGACTC 


GGCTCGTTGG 


TGCACACAGC 


GAGAGGCGAG 


GCGGCGGAAG 


300 


TGTGAGTACG 


CAATTTTGAC 


TGGCGGTGGC 


CAGAAAGTAG 


GAGAGAGGAT 


GGGTGCGAGA 


360 


GCGTCAGTGT 


TAACAGGGGG 


AAAATTAGAT 


CAATGGGAAT 


CAATTTATTT 


GAGACCAGGG 


420 


GGAAAGAAAA 


AATACAGAAT 


GAAACATTTA 


GTATGGGCAA 


GCAGGGAGCT 


GGAAAGATTC 


480 


GCTTGTAACC 


CAGGTCTCAT 


GGACACAGCG 


GACGGCTGTG 


CCAAGTTACT 


AAATCAATTA 


540 


GAACCAGCTC 


TCAAGACAGG 


GTCAGAAGAA 


CTGCGCTCTT 


TATATAACGC 


TCTAGCAGTT 


600 


CTTTATTGTG 


TCCATAGTAG 


GATACAGATA 


CACAACACAC 


AGGAAGCTTT 


GGACAAGATA 


660 


AAAGAGAAAC 


AGGAACAGCA 


CAAGCCCGAG 


CCAAAAAACC 


CAGAAGCAGG 


GGCAGCGGCA 


720 


GCAACTGATA 


GCAATATCAG 


TAGGAATTAT 


CCTCTAGTCC 


AGACTGCTCA 


AGGACAAATG 


780 


GTACATCAGC 


CGCTGACACC 


CAGAACCTTA 


AATGCTTGGG 


TGAAAGTGAT 


AGAGGAGAAG 


840 


GCCTTTAGTC 


CAGAAGTAAT 


ACCAATGTTT 


ATGGCCTTGT 


CAGAAGGGGC 


AACGCCCTCA 


900 


GATCTAAATA 


CTATGTTAAA 


TACAGTAGGG 


GGACATCAGG 


CAGCAATGCA 


GATGCTGAAG 


960 


GAAGTCATCA 


ATGAGGAAGC 


AGCAGACTGG 


GATAGGACAC 


ATCCAGTCCC 


TGTGGGACCA 


1020 


CTACCCCCAG 


GGCAACTGAG 


AGACCCTAGA 


GGAAGTGATA 


TAGCAGGAAC 


AACTAGCACC 


1080 


CTGGCAGAAC 


AGGTGGCTTG 


-GATGACTGCT 


AATCCTCCTG 


TTCCAGTAGG 


AGATATTTAT 


1140 


AGAAGATGGA 


TAGTCCTGGG 


GTTAAACAGA 


ATTGTGAGAA 


TGTATAGTCC 


TGTCAGCATT 


1200 


CTAGAGATCA 


AACAAGGACC 


AAAAGAACCC 


TTCAGAGACT 


ATGTAGACAG 


GTTCTACAAA 


1260 


ACTCTAAGAG 


CAGAGCAGGC 


AACACAGGAA 


GTAAAGAATT 


GGATGACAGA 


AACACTCTTA 


1320 


GTACAAAATG 


CAAACCCAGA 


TTGTAAACAG 


CTCCTAAAAG 


CATTAGGGCC 


AGGAGCTACC 


1380 


TTAGAAGAGA 


TGATGACGGC 


CTGCCAGGGA 


GTGGGGGGAC 


CAGCACATAA 


GGCAAGAGTG 


1440 
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CTAGCAGAGG 


CTATGTCACA 


GGTGCAGCAG 


CCAACAACTA 


GTGTCTTTGC 


ACAAAGGGGA 


1500 


AACTTTAAAG 


GCATAAGGAA 


ACCCATTAAA 


TGTTTCAATT 


GTGGCAAAGA 


GGGCCATTTG 


1560 


GCAAGAAACT 


GTAAGGCCCC 


TAGAAGAGGA 


GGCTGTTGGA 


AGTGTGGGCA 


AGAAGGACAT 


1620 


CAAATGAAAG 


ATTGTAAAAA 


TGAAGGAAGA 


CAGGCTAATT 


TTTTAGGGAA 


GAGCTGGTCT 


1680 


CCCTTCAAAG 


GGAGACCAGG 


AAACTTCCCC 


CAGACAACAA 


CAAGGAAAGA 


GCCCACAGCC 


1740 


CCGCCACTAG 


AGAGTTATGG 


GTTTCAGGAG 


GAGAAGAGCA 


CACAGGGGAA 


GGAGAtGCAG 


1800 


GAGAACCAGG 


AGAGGACAGA 


GAACTCTCTG 


TACCCACCTT 


TAACTTCCCT 


CAGATCACTC 


1860 


TTTGGCAACG 


ACCCGTCATC 


ACAGTAAAAA 


TAGGGAAAGA 


AGTAAGAGAA 


GCTCTTTTAG 


1920 


ATACAGGAGC 


TGATGATACA 


GTAATAGAAG 


AGCTACAATT 


AGAGGGAAAA 


TGGAAACCAA 


1980 


AAATGATAGG 


AGGAATTGGA 


GGATTTATCA 


AAGTGAGACA 


ATATGATAAT 


ATAACAGTAG 


2040 


ACATACAGGG 


AAGAAAAGCA 


GTTGGTACAG 


TATTAGTAGG 


ACCAACACCT 


GTTAATATTA 


2100 


TAGGAAGAAA 


TCTTTTAACC 


CAGATTGGCT 


GTACTTTAAA 


TTTTCCAATA 


AGTCCTATTG 


2160 


AAACTGTACC 


AGTAAAATTA 


AAACCAGGAA 


TGGATGGCCC 


AAAGGTAAAA 


CAATGGCCTT 


2220 


TGACAACAGA 


AAAAATAGAG 


GCATTAAGAG 


AAATTTGTAC 


AGAAATGGAA 


AAGGAAGGAA 


2280 


AAATTTCTAG 


AATAGGGCCT 


GAGAATCCAT 


ATAACACTCC 


AATTTTTGCT 


ATAAAAAAGA 


2340 


AAGATAGCAC 


TAAATGGAGA 


AAATTAGTAG 


ATTTCAGGGA 


ATTAAATAAA 


AGGACCCAAG 


2400 


ATTTTTGGGA 


AGTGCAGCTA 


GGAATTCCAC 


ATCCAGCAGG 


ATTAAAGCAG 


AAAAAATCAG 


2460 


TGACAGTTTT 


GGATGTAGGA 


GATGCTTATT 


TTTCATGTCC 


CTTGGACAAA 


GATTTTAGAA 


2520 


AGTATACAGC 


TTTTACCATA 


CCTAGTATAA 


ACAATGAGAC 


ACCTGGTATT 


AGATAGCAGT 


2580 


ATAATGTGCT 


GCCACAAGGC 


TGGAAAGGGT 


CACCAGCAAT 


TTTTCAGAGT 


ACAATGACAA 


2640 


AAATTCTAGA 


ACCATTCAGA 


GAGAAACATC 


CAGAGATAAT 


CATTTACCAG 


TACATGGATG 


2700 


ACCTCTATGT 


GGGATCTGAC 


TTAGAACTAG 


CACAACATAG 


AGAGGCAGTA 


GAAGACCTTA 


2760 


GAGATCATCT 


TTTGAAGTGG 


GGCTTTACGA 


CCCCTGACAA 


AAAACATCAG 


AAGGAACCCC 


2820 


CGTTCCTCTG 


GATGGGATAT 


GAACTCCATC 


CAGACAAATG 


GACAGTCCAG 


CCAATAAAGT 


2880 


TACCAGAAAA 


GGATGTATGG 


ACTGTCAATG 


ATATACAGAA 


ATTAGTAGGA 


AAGTTAAATT 


2940 


GGGCAAGTCA 


GATCTATCCA 


GGAATCAGAG 


TAAAACAGCT 


CTGTAAATTA 


ATCAGAGGAA 


3000 


CCAAAGCTTT 


GACAGAAGTA 


GTCAACTTTA 


CAGAAGAAGC 


AGAATTAGAA 


CTAGCAGAAA 


3060 


ACAGGGAGAT 


ATTAAAAGAA 


CCCCTGCATG 


GAGTCTATTA 


TGACCCAGGA 


AAAGAATTAG 


3120 


TAGCAGAAAT 


TCAAAAGCAA 


GGACAAGGTC 


AGTGGACATA 


TCAGATTTAT 


CAGGAGTTAC 


3180 


ATAAAAATTT 


AAAAACAGGA 


AAGTATGCAA 


AAATGAGATC 


TGCCCATACT 


AATGATATAA 


3240 


AACAGTTAGT 


TGAAGTGGTA 


AGGAAAGTGG 


CAACAGAAAG 


TATAGTAATT 


TGGGGAAAGA 


3300 


CTCCTAAATT 


TAGATTACCA 


GTACAAAAGG 


AAGTGTGGGA 


GGCATGGTGG 


ACCGATCATT 


3360 


GGCAAGCAAC 


TTGGATTCCT 


GAGTGGGAAT 


TTGTCAACAC 


TCCTCCCCTT 


GTAAAATTAT 


3420 



W05W/26a75 



PCT/FR97/02227 



22 



GGTATCAGTT 


AGAAACAGAG 


CCAATCAGTG 


GGGCAGAAAC 


TTTCTATGTA 


GATGGAGCAG 


3480 


CTAATAGGGA 


AACAAAATTG 


GGAAAAGCAG 


GTTTTGTGAC 


AGATAGGGGA 


AGACAGAAAG 


3540 


TGGTCTCTAT 


TGCAGACACC 


ACCAATCAAA 


AGGCTGAGTT 


ACAAGCTATC 


CTTATGGCCT 


3600 


TACAAGAGTC 


AGGACGGGAT 


GTAAACATAG 


TCACTGACTC 


TCAGTATGCT 


ATGGGAATAA 


3660 


TTCATTCACA 


GCCAGATAAA 


AGTGAATCAG 


AATTGGTGAG 


CCAAATAATA 


GAAGAGCTCA 


3720 


TAAAAAAGGA 


AAGAGTTTAT 


CTCTCTTGGG 


TACCTGCACA 


TAAAGGTATT 


GGAGGAAATG 


3780 


AGCAGGTAGA 


CAAATTAGTT 


AGCTCAGGAA 


TTAGAAAAAT 


ATTATTCCTA 


GATGGTATAG 


3840 


AAAAAGCCCA 


AGAAGATCAT 


GACAGATATC 


ACAGCAATTG 


GAAAGCAATG 


GCCAGTGATT 


3900 


TTAACTTACC 


CCCCATAGTG 


GCAAAAGAAA 


TAGTAGCCAG 


CTGTGACAAA 


TGCCAGCTAA 


3960 


AAGGGGAAGC 


CATGCATGGA 


CAGGTCAATT 


GTAGTCCAGG 


AGTGTGGCAA 


TTAGATTGTA 


4020 


CACACTTAGA 


GGGAAAAATC 


ATCCTTGTGG 


CGGTCCATGT 


GGCCAGTGGC 


TACTTAGAAG 


4080 


CAGAAGTTAT 


TCCTGCAGAG 


ACAGGACAGG 


AAACAGCATA 


TTTTATTTTA 


AAGTTAGCTG 


4140 


GAAGATGGCC 


AGTAAAAGTT 


ATACACACTG 


ATAATGGATC 


CAATTTCACT 


AGTGCCACTG 


4200 


TAAAAGCAGC 


CTGTTGGTGG 


GCAAATATCA 


AACAGGAATT 


TGGGATACCC 


TACAATCCTC 


4260 


AAAGTCAGGG 


AGCAGTAGAG 


TCCATGAATA 


AAGAATTAAA 


GAAAATTATA 


GGACAAATCA 


4320 


GAGATCAAGC 


AGAACATCTA 


AAGACAGCAG 


TGCAAATGGC 


GGTTTTCATT 


CACAATTTTA 


4380 


AAAGAAAAGG 


GGGGATTGGG 


GGGTACACTG 


CAGGGGAAAG 


AATAATAGAC 


ATAATAGCAA 


4440 


CAGACATACA 


GACAACAAAT 


TTACAAACAC 


AAATTTTAAA 


AGTTCAAAAT 


TTTCGGGTTT 


4500 


ATTACAGAGA 


CAGCAGAGAT 


CCCATTTGGA 


AAGGACCAGC 


CAAACTTCTG 


TGGAAAGGAG 


4560 


AAGGGGCAGT 


GGTAATTCAA 


GATAACGGGG 


ATATAAAAGT 


AGTCCCACGT 


AGGAAAGCAA 


4620 


AAATAATTAG 


GGATTATGGA 


AAACAGATGG 


CAGGTGATGG 


TTGTGTGGCA 


AGTGGACAGG 


4680 


ATGAAAATCA 


GGAAATGGAA 


TAGCTTAGTA 


AAACATCATA 


TGTATGTGTC 


AAAAAAGGCA 


4740 


AAAGGATGGT 


ATTATAGACA 


TCATTATGAA 


ACACATCACC 


CAAAAATAAG 


TTCAGAAGTA 


4800 


CATATCCCAG 


TAGGTCAGGC 


AAGATTAGTG 


ACAGTCACTT 


ATTGGGGGCT 


AACAACAGGA 


4860 


GAACAGTCTT 


GGCATCTAGG 


ACATGGAGTA 


TCCATAGAAT 


GGAGACTAAG 


AAAATACAAG 


4920 


ACACAAGTTG 


ATCCTGAAAT 


GGCAGACAAG 


CTAATACATC 


TTCATTATTT 


TGATTGTTTT 


4980 


ACAGCCTCTG 


CCATAAGGCA 


AGCGGTCTTA 


GGGAGACCAG 


TATTACCT7W5 


GTGTGAATAT 


5040 


CCAGCAGGGC 


ACAAACAGGT 


AGGCACCCTA 


CAATATCTAG 


CACTAACAGC 


CTGGGTGGGA 


5100 


GCAAAGAAGA 


GAAAGCCACC 


CTTACCTAGT 


GTGACTAAGC 


TAACAGAAGA 


TAGATGGAAC 


5160 


GAGCACCAGA 


AGATGCAGGG 


CCACAGAGGG 


AACCCTATAA 


TGAATGGGCA 


CTAGAATTAT 


5220 


TAGAAGAATT 


AAAAAATGAA 


GCTGTGCGCC 


ATTTTCCAAG 


GATTTGGCTA 


CATGGGTTAG 


5280 


GACAACACAT 


CTATAACACA 


TATGGAGACA 


CCTGGGAGGG 


GGTAGAGGCA 


ATTATCAGGA 


5340 


TACTACAACA 


ATTACTGTTT 


ATCCATTATA 


GGATTGGCTG 


CCAGCACAGC 


AGAATAGGGA 


5400 
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TCACTCCTCA 


AAGGAGAAGG 


AATGGAACCA 


GTAGATCCTA 


GATTAGAGCC 


CTGGAATCAT 


5460 


CCAGGAAGCC 


AACCTAAAAC 


AGCTTGCAAT 


AATTGCTATT 


GTAAAAGATG 


TTGCTATCAC 


5520 


TGCTTATATT 


GCTTCACAAA 


GAAAGGCTTA 


GGCATCTCAT 


ATGGCAGGAA 


GAAGCGGAGT 


5580 


CAACGACGAA 


GAACTCCTCA 


GAGCAGTAAG 


AGTCATCAAG 


ATCTTATACC 


AGAGCAGTAA 


5640 


GTAAAACCTG 


TATATATGCT 


GTCATTGGGA 


TTCATAGCGT 


TAGGAGCAGC 


AGTTAGCATA 


5700 


GCAGTAATAG 


TCTGGGCATT 


ACTATATAGA 


GAATATAAGA 


AAATAAAATT 


GCAGGAAAAA 


5760 


ATAAAACACA 


TAAGACAGAG 


AATAAGAGAA 


AGAGAAGAAG 


ATAGTGGCAA 


TGAAAGTGAT 


5820 


GGGGATGCAG 


AGTGGTTGGA 


TGGGGATGAA 


GAGTGGTTGG 


TTACTCTTCT 


ATCTTCTAGT 


5880 


AAGCTTGATC 


AAGGTAATTG 


GGTCTGAACA 


ACATTGGGTA 


ACAGTGTACT 


ATGGGGTACC 


5940 


AGTATGGAGA 


GAAGCAGAGA 


CAACTCTTTT 


CTGTGCTTCA 


GATGCTAAAG 


CCCATAGTAC 


6000 


AGAGGCTCAC 


AACATCTGGG 


CCACACAAGC 


ATGTGTTCCT 


ACTGATCCCA 


ATCCACAAGA 


6060 


AGTGCTATTA 


CCCAATGTAA 


CTGAAAAATT 


TAATATGTGG 


GAAAATAAAA 


TGGCAGACCA 


6120 


AATGCAAGAG 


GATATTATCA 


GTCTGTGGGA 


ACAGAGCTTA 


AAGCCCTGTG 


TTAAATTAAC 


6180 


CCCATTATGT 


GTAACTATGC 


TTTGTAACGA 


TAGCTATGGG 


GAGGAAAGGA 


ACAATACAAA 


6240 


TATGACAACA 


AGAGAACCAG 


ACATAGGATA 


CAAACAAATG 


AAAAATTGCT 


CATTCAATGC 


6300 


AACCACTGAG 


CTAACAGATA 


AAAAGAAGCA 


AGTTTACTCT 


CTGTTTTATG 


TAGAAGATGT 


6360 


AGTACCAATC 


AATGCCTATA 


ATAAAACATA 


TAGGCTAATA 


AATTGTAATA 


CCACAGCTGT 


6420 


GACACAAGCT 


TGTCCTAAGA 


CTTCCTTTGA 


GCCAATTCCA 


ATACATTACT 


GTGCACCACC 


6480 


AGGCTTTGCC 


ATTATGAAAT 


GTAATGAAGG 


AAACTTTAGT 


GGAAATGGAA 


GCTGTACAAA 


6540 


TGTGAGTACT 


GTACAATGCA 


CACATGGAAT 


AAAGCCAGTG 


ATATCCACTC 


AGTTAATCCT 


6600 


AAATGGAAGC 


TTAAATACAG 


ATGGAATTGT 


TATTAGAAAT 


GATAGTCACA 


GTAATCTGTT 


6660 


GGTGCAATGG 


AATGAGACAG 


TGCCAATAAA 


TTGTACAAGG 


CCAGGAAATA 


ATACAGGAGG 


6720 


ACAGGTGCAG 


ATAGGACCTG 


CTATGACATT 


TTATAACATA 


GAAAAAATAG 


TAGGAGACAT 


6780 


TAGACAAGCA 


TACTGTAATG 


TCTCTAAAGA 


ACTATGGGAA 


CCAATGTGGA 


ATAGAACAAG 


6840 


AGAGGAAATA 


AAGAAAATCC 


TGGGGAAAAA 


CAACATAACC 


TTCAGGGCTC 


GAGAGAGGAA 


6900 


TGAAGGAGAC 


CTAGAAGTGA 


CACACTTAAT 


GTTCAATTGT 


AGAGGAGAGT 


TTTTCTATTG 


6960 


TAACACTTCC 


AAATTATTTA 


ATGAGGAATT 


ACTTAACGAG 


ACAGGTGAGC 


CTATTACTCT 


7020 


GCCTTGTAGA 


ATAAGACAGA 


TTGTAAATTT 


GTGGACAAGG 


GTAGGAAAAG 


GAATTTATGC 


7080 


ACCACCAATT 


CGGGGAGTTC 


TTAACTGTAC 


CTCCAATATT 


ACTGGACTGG 


TTCTAGAATA 


7140 


TAGTGGTGGG 


CCTGACACCA 


AGGAAACAAT 


AGTATATCCC 


TCAGGAGGAA 


ACATGGTTAA 


7200 


TCTCTGGAGA 


CAAGAGTTGT 


ATAAGTACAA 


AGTAGTTAGC 


ATAGAACCCA 


TAGGAGTAGC 


7260 


ACCAGGTAAA 


GCTAAAAGAC 


GCACAGTGAG 


TAGAGAAAAA 


AGAGCAGCCT 


TTGGACTAGG 


7320 


TGCGCTGTTT 


CTTGGGTTTC 


TTGGAGCAGC 


AGGGAGCACT 


ATGGGCGCAG 


CGTCAATAAC 


7380 
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GCTGACGGTA 


CAGGCCCGGA 


CATTATTATC 


TGGGATAGTG 


CAACAGCAGA 


ATATTCTGTT 


7440 


GAGAGCAATA 


GAGGCGCAAC 


AACATTTGTT 


GCAACTCTCA 


ATCTGGGGCA 


TTAAACAGCT 


7500 


CCAGGCAAAA 


GTCCTTGCTA 


TAGAAAGATA 


CCTTAGGGAT 


CAGCAAATCC 


TAAGTCTATG 


7560 


GGGCTGCTCA 


GGAAAAACAA 


TATGCTATAC 


CACTGTGCCT 


TGGAATGAGA 


CTTGGAGCAA 


7620 


CAATACCTCT 


TATGATACAA 


TCTGGAATAA 


TTTAACCTGG 


CAACAATGGG 


ATGAGAAAGT 


7680 


AAGAAACTAT 


TCAGGTGTCA 


TTTTTGGACT 


TATAGAACAG 


GCACAAGAAC 


AACAGAACAC 


7740 


AAATGAGAAA 


TCACTCTTGG 


AATTGGATCA 


ATGGGACAGT 


CTGTGGAGCT 


GGTTTGGTAT 


7800 


TACAAAATGG 


CTGTGGTATA 


TAAAAATAGC 


TATAATGATA 


GTAGCAGGCA 


TTGTAGGCAT 


7860 


AAGAATCATA 


AGTATAGTAA 


TAACTATAAT 


AGCAAGAGTT 


AGGCAGGGAT 


ATTCTCCCCT 


7920 


TTCGTTGCAG 


ACCCTTATCC 


CAACAGCAAG 


GGGACCAGAC 


AGGCCAGAAG 


AAACAGAAGG 


7980 


AGGCGTTGGA 


GAGCAAGACA 


GAGGCAGATC 


CGTGCGATTA 


GTGAGCGGAT 


TCTCAGCTCT 


8040 


TGTCTGGGAG 


GACCTCCGGA 


ACCTGTTGAT 


CTTCCTCTAC 


CACCGCTTGA 


CAGACTCACT 


8100 


CTTGATACTG 


AGGAGGACTC 


TGGAACTCCT 


GGGACAGAGT 


CTCAGCAGGG 


GACTGCAACT 


8160 


APTGAATGAA 


CTCAGAACAC 


ACTTGTGGGG 


AATACTTGCA 


TATTGGGGAA 


AAGAGTTAAG 


8220 






TTAATACAAC 


AGCTATTGTA 


GTAGCAGAAG 


GAACAGATAG 


8280 




TTArU^APAAA 


GAATAGGAAG 


GGGAATATTA 


CACATACCTA 


GAAGAATCAG 


8340 


ACAAGGCCTA 


GAAAGAGCAC 


TGATATAAGA 


TGGGAAAGAT 


TTGGTCAAAG 


AGCAGCCTAG 


8400 


TAGGATGGCC 


AGAAATCAGA 


GAAAGAATGA 


GAAGACAAAC 


GCAAGAACCA 


GCAGTAGAGC 


8460 


CAGCAGTAGG 


AGCAGGAGCA 


GCTTCTCAAG 


ATCTAGCTAA 


TCGAGGGGCC 


ATCACCATAA 


8520 


GAAATACTAG 


AGACAATAAT 


GAAAGTATAG 


CTTGGCTAGA 


AGCACAAGAA 


GAAGAAGAGG 


8580 


AAGTAGGCTT 


TCCAGTACGC 


CCTCAGGTAC 


CATTAAGGCC 


AATAACCTAT 


AAACAGGCTT 


8640 


TTGATCTTTC 


CTTCTTTTTA 


AAAGATAAGG 


GGGGACTGGA 


AGGGCTAGTT 


TGGTCCAGAA 


8700 


AAAGGCAAGA 


TATTCTAGAC 


CTCTGGATGT 


ATCACACACA 


AGGCATCCTC 


CCTGACTGGC 


8760 


ATAACTACAC 


ACCAGGGCCA 


GGAATTAGAT 


ACCCCGTAAC 


CTTTGGATGG 


TGCTTCAAAC 


8820 


TAGTACCATT 


GTCAGCTGAA 


GAAGTAGAAG 


AGGCTAATGA 


AGGAGACAAC 


AATGCCCTCT 


8880 


TACACCCCAT 


ATGTCAACAT 


GGAGCAGATG 


ATGATCATAA 


AGAAGTGTTG 


^^fT^t TV Tl 

GTGTGoCCaA 1 




TTGACAGCTC 


CCTAGCAAGA 


AGACATGTAG 


CAAGAGAGCT 


GCATCCGGAG 


TTTTACAAGA 


9000 


ACTGCTGACA 


AGGGACTTTA 


CTGCTGACAA 


GGGACTTTAT 


ACTTGGGGAC 


TTTCCGCCAG 


9060 


GGACTTTCCA 


GGGAGGTGTG 


GTTGGGGGAG 


TGGCTTGCCC 


TCAGAGCTGC 


ATAAAAGCAG 


9120 


CCGCTTCTCG 


CTTGTACTGG 


GTCTCTCTTG 


CTGGACCAGA 


TTAGAGTCTG 


GGAGCATATT 


9180 


GGG 












9183 
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(2) INFORMATIONS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 813 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: single 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 



TTGGAAGGGC 


TAGTTTGGTC 


CAGAAAAAGG 


CAAGATATTC 


TAGACCTCTG 


gatgtatcac 


60 


ACACAAC3GCA 


TCCTCCCTGA 


CTGGCATAAC 


TACACACCAG 


GGCCAGGAAT 


TAGATACCCC 


120 


f3T A A r'(''*'F'PTfi 


GATGGTGCTT 


CAAACTAGTA 


CCATTGTCAG 


CTGAAGAAGT 


AGAAGAGGCT 


180 


AATGAAGGAG 


ACAACAATGC 


CCTCTTACAC 


CCCATATGTC 


AACATGGAGC 


AGATGATGAT 


240 


CATAAAGAAG 


TGTTGGTGTG 


GCGATTTGAC 


AGCTCCCTAG 


CAAGAAGACA 


TGTAGCAAGA 


300 


GAGCTGCATC 


CGGAGTTTTA 


CAAGAACTGC 


TGACAAGGGA 


CTTTACTGCT 


GACAAGGGAC 


360 


TTTATACTTG 


GGGACTTTCC 


GCCAGGGACT 


TTCCAGGGAG 


GTGTGGTTGG 


GGGAGTGGCT 


420 


TGCCCTCA6A 


GCTGCATAAA 


AGCAGCCGCT 


TCTCGCTTGT 


ACTGGGTCTC 


TCTTGCTGGA 


480 


CTATACAGAT 


TAGAGCCTGG 


GAGCTCTCTG 


GCTAGCAGGG 


aacccactgc 


TTAAGCCTCA 


540 


ATAAATACAG 


CTTGCCTTGA 


GTGCTAAAGT 


GGTGTGTGCC 


CATCCATTCG 


GTAACTCTGG 


600 


TACCTAGAGA 


ATCCCTCAGA 


CCATCTAGAC 


TGAGTGAAAA 


atctctagca 


GTGGCGCCCG 


660 


AACAGGGACT 


TAGTTGAAAA 


CGAAAGTAGA 


ACCGGAGGCT 


GAATCTCTCG 


ACGCAGGACT 


720 


CGGCTCGTTG 


GTGCACACAG 


CGAGAGGCGA 


GGCGGCGGAA 


gtgtgagtac 


GCAATTTTGA 


780 


CTGGCGGTGG 


CCAGAAAGTA 


GGAGAGAGGG 


AGG 






813 


(2) INFORMATIONS POUR 


LA SEQ ID NO: 3: 









(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1539 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:!. .1536 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 

ATG GGT GCG AGA GCG TCA GTG TTA ACA GGG GGA AAA TTA GAT CAA TGG ' 48 
Met Gly Ala Arg Ala Ser Val Leu Thr Gly Gly Lys Leu Asp Gin Trp 
15 10 15 



GAA TCA ATT TAT TTG AGA CCA GGG GGA AAG AAA AAA TAC AGA ATG AAA 
Glu Ser lie Tyr Leu Arg Pro Gly Gly Lys Lys Lys Tyr Arg Met Lys 
20 25 30 



96 
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CAT TTA GTA TGG GCA AGC AGG GAG CTG GAA AGA TTC GCT TGT AAC CCA 144 
His Leu Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Cys Asn Pro 
35 40 45 

GGT CTC ATG GAC ACA GCG GAC GGC TGT GCC AAG TTA CTA AAT CAA TTA 192 
Gly Leu Met Asp Thr Ala Asp Gly Cys Ala Lys Leu Leu Asn Gin Leu 
50 55 60 

GAA CCA GCT CTC AAG ACA GGG TCA GAA GAA CTG CGC TCT TTA TAT AAC 240 
Glu Pro Ala Leu Lys Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn 
65 70 75 80 

GCT CTA GCA GTT CTT TAT TGT GTC CAT AGT AGG ATA CAG ATA CAC AAC 288 
Ala Leu Ala Val Leu Tyr Cys Val His Ser Arg He Gin He His Asn 
85 90 95 

ACA CAG GAA GCT TTG GAC AAG ATA AAA GAG AAA CAG GAA CAG CAC AAG 336 
Thr Gin Glu Ala Leu Asp Lys He Lys Glu Lys Gin Glu Gin His Lys 
100 105 110 

CCC GAG CCA AAA AAC CCA GAA GCA GGG GCA GCG GCA GCA ACT GAT AGC 384 
Pro Glu Pro Lys Asn Pro Glu Ala Gly Ala Ala Ala Ala Thr Asp Ser 
115 120 125 

AAT ATC AGT AGG AAT TAT CCT CTA GTC CAG ACT GCT CAA GGA CAA ATG 432 
Asn lie Ser Arg Asn Tyr Pro Leu Val Gin Thr Ala Gin Gly Gin Met 
130 135 140 

GTA CAT CAG CCG CTG ACA CCC AGA ACC TTA AAT GCT TGG GTG AAA GTG 480 
Val His Gin Pro Leu Thr Pro Arg Thr Leu Asn Ala Trp Val Lys Val 
145 150 155 160 

ATA GAG GAG AAG GCC TTT AGT CCA GAA GTA ATA CCA ATG TTT ATG GCC 528 
lie Glu Glu Lys Ala Phe Ser Pro Glu Val lie Pro Met Phe Met Ala 
165 170 175 

TTG TCA GAA GGG GCA ACG CCC TCA GAT CTA AAT ACT ATG TTA AAT ACA 576 
Leu Ser Glu Gly Ala Thr Pro Ser Asp Leu Asn Thr Met Leu Asn Thr 
180 185 190 

GTA GGG GGA CAT CAG GCA GCA ATG CAG ATG CTG AAG GAA GTC ATC AAT 624 
Val Gly Gly His Gin Ala Ala Met Gin Met Leu Lys Glu Val He Asn 
195 200 205 

GAG GAA GCA GCA GAC TGG GAT AGG ACA CAT CCA GTC CCT GTG GGA CCA 672 
Glu Glu Ala Ala Asp Trp Asp Arg Thr His Pro Val Pro Val Gly Pro 
210 215 220 

CTA CCC CCA GGG CAA CTG AGA GAC CCT AGA GGA AGT GAT ATA GCA GGA 720 
Leu Pro Pro Gly Gin Leu Arg Asp Pro Arg Gly Ser Asp He Ala Gly 
225 230 235 240 

ACA ACT AGC ACC CTG GCA GAA CAG GTG GCT TGG ATG ACT GCT AAT CCT 768 
Thr Thr Ser Thr Leu Ala Glu Gin Val Ala Trp Met Thr Ala Asn Pro 
245 250 255 

CCT GTT CCA GTA GGA GAT ATT TAT AGA AGA TGG ATA GTC CTG GGG TTA 816 
Pro Val Pro Val Gly Asp He Tyr Arg Arg Trp He Val Leu Gly Leu 
260 265 270 

AAC AGA ATT GTG AGA ATG TAT AGT CCT GTC AGC ATT CTA GAG ATC AAA 864 
Asn Arg He Val Arg Met Tyr Ser Pro Val Ser He Leu Glu He Lys 
275 280 285 
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CAA GGA CCA AAA GAA CCC TTC AGA GAC TAT GTA GAC AGG TTC TAG AAA 912 
Gin Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys 
290 295 300 

ACT CTA AGA GCA GAG CAG GCA ACA CAG GAA GTA AAG AAT TGG ATG ACA 960 
Thr Leu Arg Ala Glu Gin Ala Thr Gin Glu Val Lys Asn Trp Met Thr 
305 310 315 320 

GAA ACA CTC TTA GTA CAA AAT GCA AAC CCA GAT TGT AAA CAG CTC CTA 1008 
Glu Thr Leu Leu Val Gin Asn Ala Asn Pro Asp Cys Lys Gin Leu Leu 
325 330 335 

AAA GCA TTA GGG CCA GGA GCT ACC TTA GAA GAG ATG ATG ACG GCC TGC 1056 
Lys Ala Leu Gly Pro Gly Ala Thr Leu Glu Glu Met Met Thr Ala Cys 
340 345 350 

CAG GGA GTG GGG GGA CCA GCA CAT AAG GCA AGA GTG CTA GCA GAG GCT 1104 
Gin Gly Val Gly Gly Pro Ala His Lys Ala Arg Val Leu Ala Glu Ala 
355 360 365 

ATG TCA CAG GTG CAG CAG CCA ACA ACT AGT GTC TTT GCA CAA AGG GGA 1152 
Met Ser Gin Val Gin Gin Pro Thr Thr Ser Val Phe Ala Gin Arg Gly 
370 375 380 

AAC TTT AAA GGC ATA AGG AAA CCC ATT AAA TGT TTC AAT TGT GGC AAA 1200 
Asn Phe Lys Gly lie Arg Lys Pro lie Lys Cys Phe Asn Cys Gly Lys 
385 390 395 400 

GAG GGC CAT TTG GCA AGA AAC TGT AAG GCC CCT AGA AGA GGA GGC TGT 1248 
Glu Gly His Leu Ala Arg Asn Cys Lys Ala Pro Arg Arg Gly Gly Cys 
405 410 415 

TGG AAG TGT GGG CAA GAA GGA CAT CAA ATG AAA GAT TGT AAA AAT GAA 1296 
Trp Lys Cys Gly Gin Glu Gly His Gin Met Lys Asp Cys Lys Asn Glu 
420 425 430 

GGA AGA CAG GCT AAT TTT TTA GGG AAG AGC TGG TCT CCC TTC AAA GGG 1344 
Gly Arg Gin Ala Asn Phe Leu Gly Lys Ser Trp Ser Pro Phe Lys Gly 
435 440 445 

AGA CCA GGA AAC TTC CCC CAG ACA ACA ACA AGG AAA GAG CCC ACA GCC 1392 
Arg Pro Gly Asn Phe Pro Gin Thr Thr Thr Arg Lys Glu Pro Thr Ala 
450 455 460 

CCG CCA CTA GAG AGT TAT GGG TTT CAG GAG GAG AAG AGC ACA CAG GGG 1440 
Pro Pro Leu Glu Ser Tyr Gly Phe Gin Glu Glu Lys Ser Thr Gin Gly 
465 470 475 480 

AAG GAG ATG CAG GAG AAC CAG GAG AGG ACA GAG AAC TCT CTG TAC CCA 1488 
Lys Glu Met Gin Glu Asn Gin Glu Arg Thr Glu Asn Ser Leu Tyr Pro 
485 490 495 

CCT TTA ACT TCC CTC AGA TCA CTC TTT GGC AAC GAC CCG TCA TCA CAG 1536 
Pro Leu Thr Ser Leu Arg Ser Leu Phe Gly Asn Asp Pro Ser - Ser Gin 
500 505 510 

TAA 1539 



(2) INFORMATIONS POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 512 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: Unfair e 



wo 98/26075 



PCr/FRy7/Q2227 



28 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

Met Gly Ala Arg Ala Ser Val Leu Thr Gly Gly Lys Leu Asp Gin Trp 
15 10 15 

Glu Ser lie Tyr Leu Arg Pro Gly Gly Lys Lys Lys Tyr Arg Met Lys 
20 25 30 

His Leu Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Cys Asn Pro 
35 40 45 

Gly Leu Met Asp Thr Ala Asp Gly Cys Ala Lys Leu Leu Asn Gin Leu 
50 55 60 

Glu Pro Ala Leu Lys Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn 
65 70 75 80 

Ala Leu Ala Val Leu Tyr Cys Val His Ser Arg lie Gin lie His Asn 
85 90 95 

Thr Gin Glu Ala Leu Asp Lys He Lys Glu Lys Gin Glu Gin His Lys 
100 105 110 

Pro Glu Pro Lys Asn Pro Glu Ala Gly Ala Ala Ala Ala Thr Asp Ser 
115 120 125 

Asn He Ser Arg Asn Tyr Pro Leu Val Gin Thr Ala Gin Gly Gin Met 
130 135 140 

Val His Gin Pro Leu Thr Pro Arg Thr Leu Asn Ala Trp Val Lys Val 
145 150 155 160 

He Glu Glu Lys Ala Phe Ser Pro Glu Val He Pro Met Phe Met Ala 
165 170 175 

Leu Ser Glu Gly Ala Thr Pro Ser Asp Leu Asn Thr Met Leu Asn Thr 
180 185 190 

Val Gly Gly His Gin Ala Ala Met Gin Met Leu Lys Glu Val He Asn 
195 200 205 

Glu Glu Ala Ala Asp Trp Asp Arg Thr His Pro Val Pro Val Gly Pro 
210 215 220 

Leu Pro Pro Gly Gin Leu Arg Asp Pro Arg Gly Ser Asp He Ala Gly 
225 230 235 240 

Thr Thr Ser Thr Leu Ala Glu Gin Val Ala Trp Met Thr Ala Asn Pro 
245 250 255 

Pro Val Pro Val Gly Asp He Tyr Arg Arg Trp He Val Leu Gly Leu 
260 265 270 

Asn Arg He Val Arg Met Tyr Ser Pro Val Ser He Leu Glu He Lys 
275 280 285 

Gin Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys 
290 295 300 

Thr Leu Arg Ala Glu Gin Ala Thr Gin Glu Val Lys Asn Trp Met Thr 
305 310 315 320 

Glu Thr Leu Leu Val Gin Asn Ala Asn Pro Asp Cys Lys Gin Leu Leu 
325 330 335 
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Lys Ala Leu Gly Pro Gly Ala Thr Leu Glu Glu Met Met Thr Ala Cys 
340 345 350 

Gin Gly Val Gly Gly Pro Ala His Lys Ala Arg Val Leu Ala Glu Ala 
355 360 365 

Met Ser Gin Val Gin Gin Pro Thr Thr Ser Val Phe Ala Gin Arg Gly 
370 375 380 

Asn Phe Lys Gly He Arg Lys Pro He Lys Cys Phe Asn Cys Gly Lys 
385 390 395 400 

Glu Gly His Leu Ala Arg Asn Cys Lys Ala Pro Arg Arg Gly Gly Cys 
405 410 415 

Trp Lys Cys Gly Gin Glu Gly His Gin Met Lys Asp Cys Lys Asn Glu 
420 425 430 

Gly Arg Gin Ala Asn Phe Leu Gly Lys Ser Trp Ser Pro Phe Lys Gly 
435 440 445 

Arg Pro Gly Asn Phe Pro Gin Thr Thr Thr Arg Lys Glu Pro Thr Ala 
450 455 460 

Pro Pro Leu Glu Ser Tyr Gly Phe Gin Glu Glu Lys Ser Thr Gin Gly 
465 470 475 480 

Lys Glu Met Gin Glu Asn Gin Glu Arg Thr Glu Asn Ser Leu Tyr Pro 
485 490 495 

Pro Leu Thr Ser Leu Arg Ser Leu Phe Gly Asn Asp Pro Ser Ser Gin 
500 505 510 



(2) INFORMATIONS POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3045 paires de bases 

( B ) TYPE : nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: Unfair e 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:!. .3042 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 

TTT TTT AGG GAA GAG CTG GTC TCC CTT CAA AGG GAG ACC AGG AAA CTT 48 
Phe Phe Arg Glu Glu Leu Val Ser Leu Gin Arg Glu Thr Arg Lys Leu 
515 520 525 

CCC CCA GAC AAC AAC AAG GAA AGA GCC CAC AGC CCC GCC ACT AGA GAG 96 
Pro Pro Asp Asn Asn Lys Glu Arg Ala His Ser Pro Ala Thr Arg Glu 
530 535 540 

TTA TGG GTT TCA GGA GGA GAA GAG CAC ACA GGG GAA GGA GAT GCA GGA 144 
Leu Trp Val Ser Gly Gly Glu Glu His Thr Gly Glu Gly Asp Ala Gly 
545 550 555 560 
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GAA CCA GGA GAG GAC AGA GAA CTC TCT GTA CCC ACC TTT AAC TTC CCT 192 

Glu Pro Gly Glu Asp Arg Glu Leu Ser Val Pro Thr Phe Asn Phe Pro 
565 570 575 

GAG ATC ACT CTT TGG CAA CGA CCC GTC ATC ACA GTA AAA ATA GGG AAA 240 
Gin lie Thr Leu Trp Gin Arg Pro Val lie Thr Val Lys lie Gly Lys 
580 585 590 

GAA GTA AGA GAA GCT CTT TTA GAT ACA GGA GCT GAT GAT ACA GTA ATA 288 
Glu Val Arg Glu Ala Leu Leu Asp Thr Gly Ala Asp Asp Thr Val lie 
595 600 605 

GAA GAG CTA CAA TTA GAG GGA AAA TGG AAA CCA AAA ATG ATA GGA GGA 336 
Glu Glu Leu Gin Leu Glu Gly Lys Trp Lys Pro Lys Met He Gly Gly 
610 615 620 

ATT GGA GGA TTT ATC AAA GTG AGA CAA TAT GAT AAT ATA ACA GTA GAC 384 
He Gly Gly Phe He Lys Val Arg Gin Tyr Asp Asn He Thr Val Asp 
625 630 635 640 

ATA CAG GGA AGA AAA GCA GTT GGT ACA GTA TTA GTA GGA CCA ACA CCT 432 
He Gin Gly Arg Lys Ala Val Gly Thr Val Leu Val Gly Pro Thr Pro 
645 650 655 

GTT AAT ATT ATA GGA AGA AAT CTT TTA ACC CAG ATT GGC TGT ACT TTA 480 
Val Asn He He Gly Arg Asn Leu Leu Thr Gin He Gly Cys Thr Leu 
660 665 670 

AAT TTT CCA ATA AGT CCT ATT GAA ACT GTA CCA GTA AAA TTA AAA CCA 528 
Asn Phe Pro He Ser Pro He Glu Thr Val Pro Val Lys Leu Lys Pro 
675 680 ^ 685 

GGA ATG GAT GGC CCA AAG GTA AAA CAA TGG CCT TTG ACA ACA GAA AAA 576 
Gly Met Asp Gly Pro Lys Val Lys Gin Trp Pro Leu Thr Thr Glu Lys 
690 695 700 

ATA GAG GCA TTA AGA GAA ATT TGT ACA GAA ATG GAA AAG GAA GGA AAA 624 
He Glu Ala Leu Arg Glu He Cys Thr Glu Met Glu Lys Glu Gly Lys 
705 710 715 720 

ATT TCT AGA ATA GGG CCT GAG AAT CCA TAT AAC ACT CCA ATT TTT GCT 672 
He Ser Arg He Gly Pro Glu Asn Pro Tyr Asn Thr Pro He Phe Ala 
725 730 735 

ATA AAA AAG AAA GAT AGC ACT AAA TGG AGA AAA TTA GTA GAT TTC AGG 720 
He Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg 
740 745 750 

GAA TTA AAT AAA AGG ACC CAA GAT TTT TGG GAA GTG CAG CTA GGA ATT 768 
Glu Leu Asn Lys Arg Thr Gin Asp Phe Trp Glu Val Gin Leu Gly He 
755 760 765 

CCA CAT CCA GCA GGA TTA AAG CAG AAA AAA TCA GTG ACA GTT TTG GAT 816 
Pro His Pro Ala Gly Leu Lys Gin Lys Lys Ser Val Thr Val Leu Asp 
770 775 780 

GTA GGA GAT GCT TAT TTT TCA TGT CCC TTG GAC AAA GAT TTT AGA AAG 864 
Val Gly Asp Ala Tyr Phe Ser Cys Pro Leu Asp Lys Asp Phe Arg Lys 
785 790 795 800 

TAT ACA GCT TTT ACC ATA CCT AGT ATA AAC AAT GAG ACA CCT GGT ATT 912 
Tyr Thr Ala Phe Thr He Pro Ser He Asn Asn Glu Thr Pro Gly He 
805 810 815 
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AGA TAG CAG TAT AAT GTG CTG CCA CAA GGC TGG AAA GGG TCA CCA GCA 960 
Arg Tyr Gin Tyr Asn Val Leu Pro Gin Gly Trp Lys Gly Ser Pro Ala 
820 825 830 

ATT TTT CAG AGT ACA ATG ACA AAA ATT CTA GAA CCA TTC AGA GAG AAA 1008 
lie Phe Gin Ser Thr Met Thr Lys He Leu Glu Pro Phe Arg Glu Lys 
835 840 845 

CAT CCA GAG ATA ATC ATT TAG CAG TAC ATG GAT GAC CTC TAT GTG GGA 1056 
His Pro Glu He He He Tyr Gin Tyr Met Asp Asp Leu Tyr Val Gly 
850 855 860 

TCT.GAC TTA GAA CTA GCA CAA CAT AGA GAG GCA GTA GAA GAC CTC AGA 1104 
Ser Asp Leu Glu Leu Ala Gin His Arg Glu Ala Val Glu Asp Leu Arg 
865 870 875 880 

GAT CAT CTT TTG AAG TGG GGC TTT ACG ACC CCT GAC AAA AAA CAT CAG 1152 
Asp His Leu Leu Lys Trp Gly Phe Thr Thr Pro Asp Lys Lys His Gin 
885 890 895 

AAG GAG CCC CCG TTC CTC TGG ATG GGA TAT GAA CTC CAT CCA GAC AAA 1200 
Lys Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys 
900 905 910 

TGG ACA GTC CAG CCA ATA AAG TTA CCA GAA AAG GAT GTA TGG ACT GTC 1248 
Trp Thr Val Gin Pro He Lys Leu Pro Glu Lys Asp Val Trp Thr Val 
915 920 925 

AAT GAT ATA CAG AAA TTA GTA GGA AAG TTA AAT TGG GCA AGT CAG ATC 1296 
Asn Asp He Gin Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gin He 
930 935 940 

TAT CCA GGA ATC AGA GTA AAA CAG CTC TGT AAA TTA ATC AGA GGA GCC 1344 
Tyr Pro Gly He Arg Val Lys Gin Leu Cys Lys Leu He Arg Gly Ala 
945 950 955 960 

AGA GCT TTG ACA GAA GTA GTC AAC TTT ACA GAA GAA GCA GAA TTA GAA 1392 
Arg Ala Leu Thr Glu Val Val Asn Phe Thr Glu Glu Ala Glu Leu Glu 
965 970 975 

CTA GCA GAA AAC AGG GAG ATA TTA AAA GAA CCC CTG CAT GGA GTC TAT 1440 
Leu Ala Glu Asn Arg Glu He Leu Lys Glu Pro Leu His Gly Val Tyr 
980 985 990 

TAT GAC CCA GGA AAA GAA TTA GTA GCA GAA ATT CAA AAG CAA GGA CAA 1488 
Tyr Asp Pro Gly Lys Glu Leu Val Ala Glu He Gin Lys Gin Gly Gin 
995 1000 1005 

GGT CAG TGG ACA TAT CAG ATT TAT CAG GAG TTA CAT AAA AAT TTA AAA 1536 
Gly Gin Trp Thr Tyr Gin He Tyr Gin Glu Leu His Lys Asn Leu Lys 
1010 1015 1020 

ACA GGA AAG TAT GCA AAA ATG AGA TCT GCC CAT ACT AAT GAT ATA AAA 1584 
Thr Gly Lys Tyr Ala Lys Met Arg Ser Ala His Thr Asn Asp He Lys 
1025 1030 1035 1040 

CAG TTA GTT GAA GTG GTA AGG AAA GTG GCA ACA GAA AGT ATA GTA ATT 1632 
Gin Leu Val Glu Val Val Arg Lys Val Ala Thr Glu Ser He Val He 
1045 1050 1055 

TGG GGA AAG ACT CCT AAA TTT AGA TTA CCA GTA CAA AAG GAA GTG TGG 1680 
Trp Gly Lys Thr Pro Lys Phe Arg Leu Pro Val Gin Lys Glu Val Trp 
1060 1065 1070 
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GAG GCA TGG TGG ACC GAT CAT TGG CAA GCA ACT TGG ATT CCT GAG TGG 1728 
Glu Ala Trp Trp Thr Asp His Trp Gin Ala Thr Trp lie Pro Glu Trp 
1075 1080 1085 

GAA TTT GTC AAC ACT CCT CCC CTT GTA AAA TTA TGG TAT CAG TTA GAA 1776 
Glu Phe Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gin Leu Glu 
1090 1095 1100 

ACA GAG CCA ATC AGT GGG GCA GAA ACT TTC TAT GTA GAT GGA GCA GCT 1824 
Thr Glu Pro lie Ser Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala 
1105 1110 1115 1120 

AAT AGG GAA ACA AAA TTG GGA AAA GCA GGT TTT GTG ACA GAT AGG GGA 1872 
Asn Arg Glu Thr Lys Leu Gly Lys Ala Gly Phe Val Thr Asp Arg Gly 
1125 1130 1135 

AGA CAG AAA GTG GTC TCT ATT GCA GAC ACC ACC AAT CAA AAG GCT GAG 1920 
Arg Gin Lys Val Val Ser lie Ala Asp Thr Thr Asn Gin Lys Ala Glu 
1140 1145 1150 

TTA CAA GCT ATC CTT ATG GCC TTA CAA GAG TCA GGA CGG GAT GTA AAC 1968 
Leu Gin Ala lie Leu Met Ala Leu Gin Glu Ser Gly Arg Asp Val Asn 
1155 1160 1165 

ATA GTC ACT GAC TCT CAG TAT GCT ATG GGA ATA ATT CAT TCA CAG CCA 2016 
He Val Thr Asp Ser Gin Tyr Ala Met Gly He He His Ser Gin Pro 
1170 1175 1180 

GAT AAA AGT GAA TCA GAA TTG GTG AGC CAA ATA ATA GAA GAG CTC ATA 2064 
Asp Lys Ser Glu Ser Glu Leu Val Ser Gin He He Glu Glu Leu He 
1185 1190 1195 1200 

AAA AAG GAA AGA GTT TAT CTC TCT TGG GTA CCT GCA CAT AAA GGT ATT 2112 
Lys Lys Glu Arg Val Tyr Leu Ser Trp Val Pro Ala His Lys Gly He 
1205 1210 1215 

GGA GGA AAT GAG CAG GTA GAC AAA TTA GTT AGC TCA GGA ATT AGA AAA 2160 
Gly Gly Asn Glu Gin Val Asp Lys Leu Val Ser Ser Gly He Arg Lys 
1220 1225 1230 

ATA TTA TTC CTA GAT GGT ATA GAA AAA GCC CAA GAA GAT CAT GAC AGA 2208 
He Leu Phe Leu Asp Gly He Glu Lys Ala Gin Glu Asp His Asp Arg 
1235 1240 1245 

TAT CAC AGC AAT TGG AAA GCA ATG GCC AGT GAT TTT AAC TTA CCC CCC 2256 
Tyr His Ser Asn Trp Lys Ala Met Ala Ser Asp Phe Asn Leu Pro Pro 
1250 1255 1260 

ATA GTG GCA AAA GAA ATA GTA GCC AGC TGT GAC AAA TGC CAG CTA AAA 2304 
He Val Ala Lys Glu He Val Ala Ser Cys Asp Lys Cys Gin Leu Lys 
1265 1270 1275 1280 

GGG GAA GCC ATG CAT GGA CAG GTC AAT TGT AGT CCA GGA GTG TGG CAA 2352 
Gly Glu Ala Met His Gly Gin Val Asn Cys Ser Pro Gly Val Trp Gin 
1285 1290 1295 

TTA GAT TGT ACA CAC TTA GAG GGA AAA ATC ATC CTT GTG GCG GTC CAT 2400 
Leu Asp Cys Thr His Leu Glu Gly Lys He He Leu Val Ala Val His 
1300 1305 1310 

GTG GCC AGT GGC TAG TTA GAA GCA GAA GTT ATT CCT GCA GAG ACA GGA 2448 
Val Ala Ser Gly Tyr Leu Glu Ala Glu Val He Pro Ala Glu Thr Gly 
1315 1320 1325 
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CAG GAA ACA GCA TAT TTT ATT TTA AAG TTA GCT GGA AGA TGG CCA GTA 2496 
Gin Glu Thr Ala Tyr Phe lie Leu Lys Leu Ala Gly Arg Trp Pro Val 
1330 1335 1340 

AAA GTT ATA CAC ACT GAT AAT GGA TCC AAT TTC ACT AGT GCC ACT GTA 2544 
Lys Val lie His Thr Asp Asn Gly Ser Asn Phe Thr Ser Ala Thr Val 
1345 1350 1355 1360 

AAA GCA GCC TGT TGG TGG GCA AAT ATC AAA CAG GAA TTT GGG ATA CCC 2592 
Lys Ala Ala Cys Trp Trp Ala Asn lie Lys Gin Glu Phe Gly lie Pro 
1365 1370 1375 

TAC AAT CCT CAA AGT CAG GGA GCA GTA GAG TCC ATG AAT AAA GAA TTA 2640 
Tyr Asn Pro Gin Ser Gin Gly Ala Val Glu Ser Met Asn Lys Glu Leu 
1380 1385 1390 

AAG AAA ATT ATA GGA CAA ATC AGA GAT CAA GCA GAA CAT CTA AAG ACA 2688 
Lys Lys lie lie Gly Gin lie Arg Asp Gin Ala Glu His Leu Lys Thr 
1395 1400 1405 

GCA GTG CAA ATG GCG GTT TTC ATT CAC AAT TTT AAA AGA AAA GGG GGG 2736 
Ala Val Gin Met Ala Val Phe lie His Asn Phe Lys Arg Lys Gly Gly 
1410 1415 1420 

ATT GGG GGG TAC ACT GCA GGG GAA AGA ATA ATA GAC ATA ATA GCA ACA 2784 
lie Gly Gly Tyr Thr Ala Gly Glu Arg lie lie Asp lie lie Ala Thr 
1425 1430 1435 1440 

GAC ATA CAG ACA ACA AAT TTA CAA ACA CAA ATT TTA AAA GTT CAA AAT 2832 
Asp lie Gin Thr Thr Asn Leu Gin Thr Gin lie Leu Lys Val Gin Asn 
1445 1450 1455 

TTT CGG GTT TAT TAC AGA GAC AGC AGA GAT CCC ATT TGG AAA GGA CCA 2880 
Phe Arg Val Tyr Tyr Arg Asp Ser Arg Asp Pro lie Trp Lys Gly Pro 
1460 1465 1470 

GCC AAA CTT CTG TGG AAA GGA GAA GGG GCA GTG GTA ATT CAA GAT AAC 2928 
Ala Lys Leu Leu Trp Lys Gly Glu Gly Ala Val Val lie Gin Asp Asn 
1475 1480 1485- 

GGG GAT ATA AAA GTA GTC CCA CGT AGG AAA GCA AAA ATA ATT AGG GAT 2976 
Gly Asp lie Lys Val Val Pro Arg Arg Lys Ala Lys lie lie Arg Asp 
1490 1495 1500 

TAT GGA AAA CAG ATG GCA GGT GAT GGT TGT GTG GCA AGT GGA CAG GAT 3024 
Tyr Gly Lys Gin Met Ala Gly Asp Gly Cys Val Ala Ser Gly Gin Asp 
1505 1510 1515 1520 

GAA AAT CAG GAA ATG GAA TAG 3045 
Glu Asn Gin Glu Met Glu 
1525 



(2) INFORMATIONS POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1014 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 



Phe 
1 



Phe Arg Glu Glu Leu Val Ser Leu Gin Arg Glu Thr Arg Lys Leu 
5 10 15 
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Asp His Leu Leu Lys Trp Gly Phe Thr Thr Pro Asp Lys Lys His Gin 
370 375 380 

Lys Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys 
385 390 395 400 

Trp Thr Val Gin Pro lie Lys Leu Pro Glu Lys Asp Val Trp Thr Val 
405 410 415 

Asn Asp lie Gin Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gin lie 
420 425 430 

Tyr Pro Gly lie Arg Val Lys Gin Leu Cys Lys Leu lie Arg Gly Ala 
435 440 445 

Arg Ala Leu Thr Glu Val Val Asn Phe Thr Glu Glu Ala Glu Leu Glu 
450 455 460 

Leu Ala Glu Asn Arg Glu He Leu Lys Glu Pro Leu His Gly Val Tyr 
465 470 475 480 

Tyr Asp Pro Gly Lys Glu Leu Val Ala Glu He Gin Lys Gin Gly Gin 
485 490 495 

Gly Gin Trp Thr Tyr Gin lie Tyr Gin Glu Leu His Lys Asn Leu Lys 
500 505 510 

Thr Gly Lys Tyr Ala Lys Met Arg Ser Ala His Thr Asn Asp He Lys 
515 ' 520 525 

Gin Leu Val Glu Val Val Arg Lys Val Ala Thr Glu Ser He Val He 
530 535 540 

Trp Gly Lys Thr Pro Lys Phe Arg Leu Pro Val Gin Lys Glu Val Trp 
545 550 555 560 

Glu Ala Trp Trp Thr Asp His Trp Gin Ala Thr Trp He Pro Glu Trp 
565 570 575 

Glu Phe Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gin Leu Glu 
580 585 590 

Thr Glu Pro He Ser Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala 
595 600 605 

Asn Arg Glu Thr Lys Leu Gly Lys Ala Gly Phe Val Thr Asp Arg Gly 
610 615 620 

Arg Gin Lys Val Val Ser He Ala Asp Thr Thr Asn Gin Lys Ala Glu 
625 630 635 640 

Leu Gin Ala He Leu Met Ala Leu Gin Glu Ser Gly Arg Asp Val Asn 
645 650 655 

He Val Thr Asp Ser Gin Tyr Ala Met Gly He He His Ser Gin Pro 
660 665 670 

Asp Lys Ser Glu Ser Glu Leu Val Ser Gin He He Glu Glu Leu He 
675 680 685 

Lys Lys Glu Arg Val Tyr Leu Ser Trp Val Pro Ala His Lys Gly He 
690 695 700 

Gly Gly Asn Glu Gin Val Asp Lys Leu Val Ser Ser Gly He Arg Lys 
705 710 715 720 
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lie Leu Phe Leu Asp Gly lie Glu Lys Ala Gin Glu Asp His Asp Arg 
725 730 735 

Tyr His Ser Asn Trp Lys Ala Met Ala Ser Asp Phe Asn Leu Pro Pro 
740 745 750 

lie Val Ala Lys Glu lie Val Ala Ser Cys Asp Lys Cys Gin Leu Lys 
755 760 765 

Gly Glu Ala Met His Gly Gin Val Asn Cys Ser Pro Gly Val Trp Gin 
770 775 780 

Leu Asp Cys Thr His Leu Glu Gly Lys lie lie Leu Val Ala Val His 
785 790 795 800 

Val Ala Ser Gly Tyr Leu Glu Ala Glu Val lie Pro Ala Glu Thr Gly 
805 810 815 

Gin Glu Thr Ala Tyr Phe lie Leu Lys Leu Ala Gly Arg Trp Pro Val 
820 825 830 

Lys Val lie His Thr Asp Asn Gly Ser Asn Phe Thr Ser Ala Thr Val 
835 840 845 

Lys Ala Ala Cys Trp Trp Ala Asn lie Lys Gin Glu Phe Gly lie Pro 
850 855 860 

Tyr Asn Pro Gin Ser Gin Gly Ala Val Glu Ser Met Asn Lys Glu Leu 
865 870 875 880 

Lys Lys lie lie Gly Gin lie Arg Asp Gin Ala Glu His Leu Lys Thr 
885 890 895 

Ala Val Gin Met Ala Val Phe lie His Asn Phe Lys Arg Lys Gly Gly 
900 905 910 

lie Gly Gly Tyr Thr Ala Gly Glu Arg lie lie Asp lie He Ala Thr 
915 920 925 

Asp He Gin Thr Thr Asn Leu Gin Thr Gin He Leu Lys Val Gin Asn 
930 935 940 

Phe Arg Val Tyr Tyr Arg Asp Ser Arg Asp Pro He Trp Lys Gly Pro 
945 950 955 960 

Ala Lys Leu Leu Trp Lys Gly Glu Gly Ala Val Val He Gin Asp Asn 
965 970 975 

Gly Asp He Lys Val Val Pro Arg Arg Lys Ala Lys He He Arg Asp 
980 985 990 

Tyr Gly Lys Gin Met Ala Gly Asp Gly Cys Val Ala Ser Gly Gin Asp 
995 1000 1005 

Glu Asn Gin Glu Met Glu 
1010 

(2) INFORMATIONS POOR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 579 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: siinple 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECXn^E: ADN (genomique) 
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(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:!. .576 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7: 

ATG GAA AAC AGA TGG CAG GTG ATG GTT GTG TGG CAA GTG GAC AGG ATG 48 
Met Glu Asn Arg Trp Gin Val Met Val Val Trp Gin Val Asp Arg Met 
1015 1020 1025 1030 

AAA ATC AGG AAA TGG AAT AGC TTA GTA AAA CAT CAT ATG TAT GTG TCA 96 
Lys lie Arg Lys Trp Asn Ser Leu Val Lys His His Met Tyr Val Ser 
1035 1040 1045 

AAA AAG GCA AAA GGA TGG TAT TAT AGA CAT CAT TAT GAA ACA CAT CAC 144 
Lys Lys Ala Lys Gly Trp Tyr Tyr Arg His His Tyr Glu Thr His His 
1050 1055 1060 

CCA AAA ATA AGT TCA GAA GTA CAT ATC CCA GTA GGT CAG GCA AGA TTA 192 
Pro Lys lie Ser Ser Glu Val His lie Pro Val Gly Gin Ala Arg Leu 
1065 1070 1075 

GTG ACA GTC ACT TAT TGG GGG CTA ACA ACA GGA GAA CAG TCT TGG CAT 240 
Val Thr Val Thr Tyr Trp Gly Leu Thr Thr Gly Glu Gin Ser Trp His 
1080 1085 1090 

CTA GGA CAT GGA GTA TCC ATA GAA TGG AGA CTA AGA AAA TAC AAG ACA 288 
Leu Gly His Gly Val Ser lie Glu Trp Arg Leu Arg Lys Tyr Lys Thr 
1095 1100 1105 1110 

CAA GTT GAT CCT GAA ATG GCA GAC AAG CTA ATA CAT CTT CAT TAT TTT 336 
Gin Val Asp Pro Glu Met Ala Asp Lys Leu lie His Leu His Tyr Phe 
1115 1120 1125 

GAT TGT TTT ACA GCC TCT GCC ATA AGG CAA GCG GTC TTA GGG AGA CCA 384 
Asp Cys Phe Thr Ala Ser Ala lie Arg Gin Ala Val Leu Gly Arg Pro 
1130 1135 1140 

GTA TTA CCT AGG TGT GAA TAT CCA GCA GGG CAC AAA CAG GTA GGC ACC 432 
Val Leu Pro Arg Cys Glu Tyr Pro Ala Gly His Lys Gin Val Gly Thr 
1145 1150 1155 

CTA CAA TAT CTA GCA CTA ACA GCC TGG GTG GGA GCA AAG AAG AGA AAG 480 
Leu Gin Tyr Leu Ala Leu Thr Ala Trp Val Gly Ala Lys Lys Arg Lys 
1160 1165 1170 

CCA CCC TTA CCT AGT GTG ACT AAG CTA ACA GAA GAT AGA TGG AAC GAG 528 
Pro Pro Leu Pro Ser Val Thr Lys Leu Thr Glu Asp Arg Trp Asn Glu 
1175 1180 1185 1190 

CAC CAG AAG ATG CAG GGC CAC AGA GGG AAC CCT ATA ATG AAT GGG CAC 576 
His Gin Lys Met Gin Gly His Arg Gly Asn Pro lie Met Asn Gly His 
1195 1200 1205 

TAG 579 



(2) INFORMATIONS POUR LA SEQ ID NO: 8: 

(i) CARACTE RIST IQUES DE LA SEQUENCE: 

(A) LONGUEUR: 192 acides amines 

(B) TYPE: acide amin^ 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: prot^ine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 

Met Glu Asn Arg Trp Gin Val Met Val Val Trp Gin Val Asp Arg Met 
1 5 10 15 

Lys lie Arg Lys Trp Asn Ser Leu Val Lys His His Met Tyr Val Ser 
20 25 30 

Lys Lys Ala Lys Gly Trp Tyr Tyr Arg His His Tyr Glu Thr His His 
35 40 45 

Pro Lys lie Ser Ser Glu Val His lie Pro Val Gly Gin Ala Arg Leu 
50 55 60 

Val Thr Val Thr Tyr Trp Gly Leu Thr Thr Gly Glu Gin Ser Trp His 
65 70 75 80 

Leu Gly His Gly Val Ser lie Glu Trp Arg Leu Arg Lys Tyr Lys Thr 
85 90 95 

Gin Val Asp Pro Glu Met Ala Asp Lys Leu lie His Leu His Tyr Phe 
100 105 110 

Asp Cys Phe Thr Ala Ser Ala lie Arg Gin Ala Val Leu Gly Arg Pro 
115 120 125 

Val Leu Pro Arg Cys Glu Tyr Pro Ala Gly His Lys Gin Val Gly Thr 
130 . 135 140 

Leu Gin Tyr Leu Ala Leu Thr Ala Trp Val Gly Ala Lys Lys Arg Lys 
145 150 155 160 

Pro Pro Leu Pro Ser Val Thr Lys Leu Thr Glu Asp Arg Trp Asn Glu 
165 170 175 

His Gin Lys Met Gin Gly His Arg Gly Asn Pro He Met Asn Gly His 
180 185 190 



(2) INFORMATIONS POUR LA SEQ ID NO: 9: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 288 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 1. .285 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9: 

ATG GAA CGA GCA CCA GAA GAT GCA GGG CCA CAG AGG GAA CCC TAT AAT 48 
Met Glu Arg Ala Pro Glu Asp Ala Gly Pro Gin Arg Glu Pro Tyr Asn 
195 200 205 



GAA 
Glu 



TGG GCA CTA GAA TTA TTA GAA GAA TTA AAA AAT GAA GCT GTG CGC 
Trp Ala Leu Glu Leu Leu Glu Glu Leu Lys Asn Glu Ala Val Arg 
210 215 220 



96 
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CAT TTT CCA AGG ATT TGG CTA CAT GGG TTA GGA CAA CAC ATC TAT AAC 
His Phe Pro Arg lie Trp Leu His Gly Leu Gly Gin His lie Tyr Asn 
225 230 235 240 

ACA TAT GGA GAC ACC TGG GAG GGG GTA GAG GCA ATT ATC AGG ATA CTA 
Thr Tyr Gly Asp Thr Trp Glu Gly Val Glu Ala lie He Arg lie Leu 
245 250 255 

CAA CAA TTA CTG TTT ATC CAT TAT AGG ATT GGC TGC CAG CAC AGC AGA 
Gin Gin Leu Leu Phe He His Tyr Arg He Gly Cys Gin His Ser Arg 
260 265 270 

ATA GGG ATC ACT CCT CAA AGG AGA AGG AAT GGA ACC AGT AGA TCC 

lie Gly He Thr Pro Gin Arg Arg Arg Asn Gly Thr Ser Arg Ser 

275 280 285 

TAG 



(2) INFORMATIONS POUR LA SEQ ID NO: 10: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 95 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 

Met Glu Arg Ala Pro Glu Asp Ala Gly Pro Gin Arg Glu Pro Tyr Asn 
15 10 15 

Glu Trp Ala Leu Glu Leu Leu Glu Glu Leu Lys Asn Glu Ala Val Arg 
20 25 30 

His Phe Pro Arg He Trp Leu His Gly Leu Gly Gin His He Tyr Asn 
35 40 45 

Thr Tyr Gly Asp Thr Trp Glu Gly Val Glu Ala He He Arg He Leu 
50 55 60 

Gin Gin Leu Leu Phe He His Tyr Arg He Gly Cys Gin His Ser Arg 
65 70 75 80 

He Gly He Thr Pro Gin Arg Arg Arg Asn Gly Thr Ser Arg Ser 
85 90 95 

(2) INFORMATIONS POUR LA SEQ ID NO: 11: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 252 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT :1. .249 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 

ATG CTG TCA TTG GGA TTC ATA GCG TTA GGA GCA GCA GTT AGC ATA GCA 48 
Met Leu Ser Leu Gly Phe lie Ala Leu Gly Ala Ala Val Ser lie Ala 
100 105 110 

GTA ATA GTC TGG GCA TTA CTA TAT AGA GAA TAT AAG AAA ATA AAA TTG 96 
Val lie Val Trp Ala Leu Leu Tyr Arg Glu Tyr Lys Lys lie Lys Leu 
115 120 125 

CAG GAA AAA ATA AAA CAC ATA AGA CAG AGA ATA AGA GAA AGA GAA GAA 144 
Gin Glu Lys lie Lys His lie Arg Gin Arg lie Arg Glu Arg Glu Glu 
130 135 140 

GAT AGT GGC AAT GAA AGT GAT GGG GAT GCA GAG TGG TTG GAT GGG GAT 192 
Asp Ser Gly Asn Glu Ser Asp Gly Asp Ala Glu Trp Leu Asp Gly Asp 
145 150 155 

GAA GAG TGG TTG GTT ACT CTT CTA TCT TCT AGT AAG CTT GAT CAA GGT ' 240 
Glu Glu Trp Leu Val Thr Leu Leu Ser Ser Ser Lys Leu Asp Gin Gly 
160 165 170 175 

AAT TGG GTC TGA 252 
Asn Trp Val 



(2) INFORMATIONS POUR LA SEQ ID NO: 12: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 83 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 

Met Leu Ser Leu Gly Phe lie Ala Leu Gly Ala Ala Val Ser lie Ala 
1 5 10 15 

Val lie Val Trp Ala Leu Leu Tyr Arg Glu Tyr Lys Lys lie Lys Leu 
20 . 25 30 

Gin Glu Lys lie Lys His lie Arg Gin Arg lie Arg Glu Arg Glu Glu 
35 40 45 

Asp Ser Gly Asn Glu Ser Asp Gly Asp Ala Glu Trp Leu Asp Gly Asp 
50 55 60 

Glu Glu Trp Leu Val Thr Leu Leu Ser Ser Ser Lys Leu Asp Gin Gly 
65 70 75 80 

Asn Trp Val 

(2) INFORMATIONS POUR LA SEQ ID NO: 13: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 306 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ADN (genomique) 
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(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:!. .303 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 

ATG GAA CCA GTA GAT CCT AGA TTA GAG CCC TGG AAT CAT CCA GGA AGC 48 
Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Asn His Pro Gly Ser 
85 90 95 

CAA CCT AAA ACA GCT TGC AAT AAT TGC TAT TGT AAA AGA TGT TGC TAT 96 
Gin Pro Lys Thr Ala Cys Asn Asn Cys Tyr Cys Lys Arg Cys Cys Tyr 
100 105 110 115 

CAC TGC TTA TAT TGC TTC ACA AAG AAA GGC TTA GGC ATC TCA TAT GGC 144 
His Cys Leu Tyr Cys Phe Thr Lys Lys Gly Leu Gly lie Ser Tyr Gly 
120 125 130 

AGG AAG AAG CGG AGT CAA CGA CGA AGA ACT CCT CAG AGC AGT AAG AGT 192 
Arg Lys Lys Arg Ser Gin Arg Arg Arg Thr Pro Gin Ser Ser Lys Ser 
135 140 145 

CAT CAA GAT CTT ATA CCA GAG CAG CCC TTA TCC CAA CAG CAA GGG GAC 240 
His Gin Asp Leu lie Pro Glu Gin Pro Leu Ser Gin Gin Gin Gly Asp 
150 155 160 

CAG ACA GGC CAG AAG AAA CAG AAG GAG GCG TTG GAG AGC AAG ACA GAG 288 
Gin Thr Gly Gin Lys Lys Gin Lys Glu Ala Leu Glu Ser Lys Thr Glu 
165 170 175 

GCA GAT CCG TGC GAT TAG 306 

Ala Asp Pro Cys Asp 

180 

(2) INFORMATIONS POUR LA SEQ ID NO: 14: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 101 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lindaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 

Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Asn His Pro Gly Ser 
15 10 15 

Gin Pro Lys Thr Ala Cys Asn Asn Cys Tyr Cys Lys Arg Cys Cys Tyr 
20 25 30 

His Cys Leu Tyr Cys Phe Thr Lys Lys Gly Leu Gly lie Ser Tyr Gly 
35 40 45 

Arg Lys Lys Arg Ser Gin Arg Arg Arg Thr Pro Gin Ser Ser Lys Ser 
50 55 60 

His Gin Asp Leu lie Pro Glu Gin Pro Leu Ser Gin Gin Gin Gly Asp 
65 70 75 80 

Gin Thr Gly Gin Lys Lys Gin Lys Glu Ala Leu Glu Ser Lys Thr Glu 
85 90 95 



Ala Asp Pro Cys Asp 
100 
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(2) INFORMATIONS POUR LA SEQ ID NO: 15: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 369 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (g^nomique) 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 1. .366 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15: 

ATG GCA GGA AGA AGC GGA GTC AAC GAC GAA GAA CTC CTC AGA GCA GTA 48 
Met Ala Gly Arg Ser Gly Val Asn Asp Glu Glu Leu Leu Arg Ala Val 
105 110 115 

AGA GTC ATC AAG ATC TTA TAC CAG AGC AGT TAT CCC AAC AGC AAG GGG 96 
Arg Val lie Lys lie Leu Tyr Gin Ser Ser Tyr Pro Asn Ser Lys Gly 
120 125 130 

ACC AGA CAG GCC AGA AGA AAC AGA AGG AGG CGT TGG AGA GCA AGA CAG 144 
Thr Arg Gin Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Ala Arg Gin 
135 140 145 

AGG CAG ATC CGT GCG ATT AGT GAG CGG ATT CTC AGC TCT TGT CTG GGA 192 
Arg Gin lie Arg Ala lie Ser Glu Arg lie Leu Ser Ser Cys Leu Gly 
150 155 160 165 

GGA CCT CCG GAA CCT GTT GAT CTT CCT CTA CCA CCG CTT GAC AGA CTC 240 
Gly Pro Pro Glu Pro Val Asp Leu Pro Leu Pro Pro Leu Asp Arg Leu 
170 175 180 

ACT CTT GAT ACT GAG GAG GAC TCT GGA ACT CCT GGG ACA GAG TCT CAG 288 
Thr Leu Asp Thr Glu Glu Asp Ser Gly Thr Pro Gly Thr Glu Ser Gin 
185 190 195 

CAG GGG ACT GCA ACT ACT GAA TGA ACT CAG AAC ACA CTT GTG GGG AAT 336 
Gin Gly Thr Ala Thr Thr Glu * Thr Gin Asn Thr Leu Val Gly Asn 
200 205 210 

ACT TGC ATA TTG GGG AAA AGA GTT AAG GGA TAG 369 
Thr Cys lie Leu Gly Lys Arg Val Lys Gly 
215 220 



(2) IXIFORMATIONS POUR LA SEQ ID NO: 16: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 122 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 16: 

Met Ala Gly Arg Ser Gly Val Asn Asp Glu Glu Leu Leu Arg Ala Val 
15 10 15 



Arg Val lie Lys lie Leu Tyr Gin Ser Ser Tyr Pro 
20 25 



Asn Ser Lys Gly 
30 
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Thr Arg Gin Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Ala Arg Gin 
35 40 45 

Arg Gin lie Arg Ala lie Ser Glu Arg lie Leu Ser Ser Cys Leu Gly 
50 55 60 

Gly Pro Pro Glu Pro Val Asp Leu Pro Leu Pro Pro Leu Asp Arg Leu 
65 70 75 80 

Thr Leu Asp Thr Glu Glu Asp Ser Gly Thr Pro Gly Thr Glu Ser Gin 
85 90 95 

Gin Gly Thr Ala Thr Thr Glu * Thr Gin Asn Thr Leu Val Gly Asn 
100 105 110 

Thr Cys lie Leu Gly Lys Arg Val Lys Gly 
115 120 

(2) INFORMATIONS POUR LA SEQ ID NO: 17: 

(i) CARACTERISTIQOES DE LA SEQUENCE: 

(A) LONGUEUR: 2559 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genoraique) 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:!. .2556 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17: 

ATG AAA GTG ATG GGG ATG CAG AGT GGT TGG ATG GGG ATG AAG AGT GGT 48 
Met Lys Val Met Gly Met Gin Ser Gly Trp Met Gly Met Lys Ser Gly 
125 130 135 

TGG TTA CTC TTC TAT CTT CTA GTA AGC TTG ATC AAG GTA ATT GGG TCT 96 
Trp Leu Leu Phe Tyr Leu Leu Val Ser Leu lie Lys Val He Gly Ser 
140 145 150 

GAA CAA CAT TGG GTA ACA GTG TAC TAT GGG GTA CCA GTA TGG AGA GAA 144 
Glu Gin His Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Arg Glu 
155 160 165 170 

GCA GAG ACA ACT CTT TTC TGT GCT TCA GAT GCT AAA GCC CAT AGT ACA 192 
Ala Glu Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala His Ser Thr 
175 180 185 

GAG GCT CAC AAC ATC TGG GCC ACA CAA GCA TGT GTT CCT ACT GAT CCC 240 
Glu Ala His Asn He Trp Ala Thr Gin Ala Cys Val Pro Thr Asp Pro 
190 195 200 

AAT CCA CAA GAA GTG CTA TTA CCC AAT GTA ACT GAA AAA TTT AAT ATG 288 
Asn Pro Gin Glu Val Leu Leu Pro Asn Val Thr Glu Lys Phe Asn Met 
205 210 215 

TGG GAA AAT AAA ATG GCA GAC CAA ATG CAA GAG GAT ATT ATC AGT CTG 336 
Trp Glu Asn Lys Met Ala Asp Gin Met Gin Glu Asp He He Ser Leu 
220 225 230 
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TGG GAA CAG AGC TTA AAG CCC TGT GTT AAA TTA ACC CCA TTA TGT GTA 384* 
Trp Glu Gin Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val 
235 240 245 250 

ACT ATG CTT TGT AAC GAT AGC TAT GGG GAG GAA AGG AAC AAT ACA AAT 432 
Thr Met Leu Cys Asn Asp Ser Tyr Gly Glu Glu Arg Asn Asn Thr Asn 
255 260 265 

ATG ACA ACA AGA GAA CCA GAC ATA GGA TAC AAA CAA ATG AAA AAT TGC 480 
Met Thr Thr Arg Glu Pro Asp lie Gly Tyr Lys Gin Met Lys Asn Cys 
270 275 280 

TCA TTC AAT GCA ACC ACT GAG CTA ACA GAT AAA AAG AAG CAA GTT TAC 528 
Ser Phe Asn Ala Thr Thr Glu Leu Thr Asp Lys Lys Lys Gin Val Tyr 
285 290 295 

TCT CTG TTT TAT GTA GAA GAT GTA GTA CCA ATC AAT GCC TAT AAT AAA 576 
Ser Leu Phe Tyr Val Glu Asp Val Val Pro lie Asn Ala Tyr Asn Lys 
300 305 310 

ACA TAT AGG CTA ATA AAT TGT AAT ACC ACA GCT GTG ACA CAA GCT TGT 624 
Thr Tyr Arg Leu lie Asn Cys Asn Thr Thr Ala Val Thr Gin Ala Cys 
315 320 325 330 

CCT AAG ACT TCC TTT GAG CCA ATT CCA ATA CAT TAC TGT GCA CCA CCA 672 
Pro Lys Thr Ser Phe Glu Pro lie Pro lie His Tyr Cys Ala Pro Pro 
335 340 345 

GGC TTT GCC ATT ATG AAA TGT AAT GAA GGA AAC TTT AGT GGA AAT GGA 720 
Gly Phe Ala lie Met Lys Cys Asn Glu Gly Asn Phe Ser Gly Asn Gly 
350 355 360 

AGC TGT ACA AAT GTG AGT ACT GTA CAA TGC ACA CAT GGA ATA AAG CCA 768 
Ser Cys Thr Asn Val Ser Thr Val Gin Cys Thr His Gly He Lys Pro 
365 370 375 

GTG ATA TCC ACT CAG TTA ATC CTA AAT GGA AGC TTA AAT ACA GAT GGA 816 
Val lie Ser Thr Gin Leu He Leu Asn Gly Ser Leu Asn Thr Asp Gly 
380 385 390 

ATT GTT ATT AGA AAT GAT AGT CAC AGT AAT CTG TTG GTG CAA TGG AAT 864 
He Val He Arg Asn Asp Ser His Ser Asn Leu Leu Val Gin Trp Asn 
395 400 405 410 

GAG ACA GTG CCA ATA AAT TGT ACA AGG CCA GGA AAT AAT ACA GGA GGA 912 
Glu Thr Val Pro He Asn Cys Thr Arg Pro Gly Asn Asn Thr Gly Gly 
415 420 425 

CAG GTG CAG ATA GGA CCT GCT ATG ACA TTT TAT AAC ATA GAA AAA ATA 960 
Gin Val Gin He Gly Pro Ala Met Thr Phe Tyr Asn He Glu Lys He 
430 435 440 

GTA GGA GAC ATT AGA CAA GCA TAC TGT AAT GTC TCT AAA GAA CTA TGG 1008 
Val Gly Asp He Arg Gin Ala Tyr Cys Asn Val Ser Lys Glu Leu Trp 
445 450 455 

GAA CCA ATG TGG AAT AGA ACA AGA GAG GAA ATA AAG AAA ATC CTG GGG 1056 
Glu Pro Met Trp Asn Arg Thr Arg Glu Glu He Lys Lys He Leu Gly 
460 465 470 

AAA AAC AAC ATA ACC TTC AGG GCT CGA GAG AGG AAT GAA GGA GAC CTA 1104 
Lys Asn Asn He Thr Phe Arg Ala Arg Glu Arg Asn Glu Gly Asp Leu 
475 480 485 490 
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GAA GTG ACA CAC TTA ATG TTC AAT TGT AGA GGA GAG TTT TTC TAT TGT 1152 
Glu Val Thr His Leu Met Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys 
495 500 505 

AAC ACT TCC AAA TTA TTT AAT GAG GAA TTA CTT AAC GAG ACA GGT GAG 1200 
Asn Thr Ser Lys Leu Phe Asn Glu Glu Leu Leu Asn Glu Thr Gly Glu 
510 515 520 

CCT ATT ACT CTG CCT TGT AGA ATA AGA CAG ATT GTA AAT TTG TGG ACA 1248 
Pro lie Thr Leu Pro Cys Arg lie Arg Gin lie Val Asn Leu Trp Thr 
525 530 535 

AGG GTA GGA AAA GGA ATT TAT GCA CCA CCA ATT CGG GGA GTT CTT AAC 1296 
Arg Val Gly Lys Gly He Tyr Ala Pro Pro He Arg Gly Val Leu Asn 
540 545 550 

TGT ACC TCC AAT ATT ACT GGA CTG GTT CTA GAA TAT AGT GGT GGG CCT 1344 
Cys Thr Ser Asn He Thr Gly Leu Val Leu Glu Tyr Ser Gly Gly Pro 
555 560 565 570 

GAC ACC AAG GAA ACA ATA GTA TAT CCC TCA GGA GGA AAC ATG GTT AAT 1392 
Asp Thr Lys Glu Thr He Val Tyr Pro Ser Gly Gly Asn Met Val Asn 
575 580 585 

CTC TGG AGA CAA GAG TTG TAT AAG TAC AAA GTA GTT AGC ATA GAA CCC 1440 
Leu Trp Arg Gin Glu Leu Tyr Lys Tyr Lys Val Val Ser He Glu Pro 
590 595 600 

ATA GGA GTA GCA CCA GGT AAA GCT AAA AGA CGC ACA GTG AGT AGA GAA 1488 
He Gly Val Ala Pro Gly Lys Ala Lys Arg Arg Thr Val Ser Arg Glu 
605 610 615 

AAA AGA GCA GCC TTT GGA CTA GGT GCG CTG TTT CTT GGG TTT CTT GGA 1536 
Lys Arg Ala Ala Phe Gly Leu Gly Ala Leu Phe Leu Gly Phe Leu Gly 
620 625 630 

GCA GCA GGG AGC ACT ATG GGC GCA GCG TCA ATA ACG CTG ACG GTA CAG 1584 
Ala Ala Gly Ser Thr Met Gly Ala Ala Ser He Thr Leu Thr Val Gin 
635 640 645 650 

GCC CGG ACA TTA TTA TCT GGG ATA GTG CAA CAG CAG AAT ATT CTG TTG 1632 
Ala Arg Thr Leu Leu Ser Gly He Val Gin Gin Gin Asn He Leu Leu 
655 660 665 

AGA GCA ATA GAG GCG CAA CAA CAT TTG TTG CAA CTC TCA ATC TGG GGC 1680 
Arg Ala He Glu Ala Gin Gin His Leu Leu Gin Leu Ser He Trp Gly 
670 675 680 

ATT AAA CAG CTC CAG GCA AAA GTC CTT GCT ATA GAA AGA TAC CTT AGG 1728 
He Lys Gin Leu Gin Ala Lys Val Leu Ala He Glu Arg Tyr Leu Arg 
685 690 695 

GAT CAG CAA ATC CTA AGT CTA TGG GGC TGC TCA GGA AAA ACA ATA TGC 1776 
Asp Gin Gin He Leu Ser Leu Trp Gly Cys Ser Gly Lys Thr He Cys 
700 705 710 

TAT ACC ACT GTG CCT TGG AAT GAG ACT TGG AGC AAC AAT ACC TCT TAT 1824 
Tyr Thr Thr Val Pro Trp Asn Glu Thr Trp Ser Asn Asn Thr Ser Tyr 
715 720 725 730 

GAT ACA ATC TGG AAT AAT TTA ACC TGG CAA CAA TGG GAT GAG AAA GTA 1872 
Asp Thr He Trp Asn Asn Leu Thr Trp Gin Gin Trp Asp Glu Lys Val 
735 740 745 
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AGA AAC TAT TCA GGT GTC ATT TTT GGA CTT ATA GAA CAG GCA CAA GAA 1920 
Arg Asn Tyr Ser Gly Val He Phe Gly Leu He Glu Gin Ala Gin Glu 
750 755 760 

CAA CAG AAC ACA AAT GAG AAA TCA CTC TTG GAA TTG GAT CAA TGG GAC 1968 
Gin Gin Asn Thr Asn Glu Lys Ser Leu Leu Glu Leu Asp Gin Trp Asp 
765 770 775 

AGT CTG TGG AGC TGG TTT GGT ATT ACA AAA TGG CTG TGG TAT ATA AAA 2016 
Ser Leu Trp Ser Trp Phe Gly He Thr Lys Trp Leu Trp Tyr He Lys 
780 785 790 

ATA GCT ATA ATG ATA GTA GCA GGC ATT GTA GGC ATA AGA ATC ATA AGT . 2064 
He Ala He Met He Val Ala Gly He Val Gly He Arg He He Ser 
795 800 805 810 

ATA GTA ATA ACT ATA ATA GCA AGA GTT AGG CAG GGA TAT TCT CCC CTT 2112 
He Val He Thr He He Ala Arg Val Arg Gin Gly Tyr Ser Pro Leu 
815 820 825 

TCG TTG CAG ACC CTT ATC CCA ACA GCA AGG GGA CCA GAC AGG CCA GAA 2160 
Ser Leu Gin Thr Leu He Pro Thr Ala Arg Gly Pro Asp Arg Pro Glu 
830 835 840 

GAA ACA GAA GGA GGC GTT GGA GAG CAA GAC AGA GGC AGA TCC GTG CGA 2208 
Glu Thr Glu Gly Gly Val Gly Glu Gin Asp Arg Gly Arg Ser Val Arg 
845 850 855 

TTA GTG AGC GGA TTC TCA GCT CTT GTC TGG GAG GAC CTC CGG AAC CTG 2256 
Leu Val Ser Gly Phe Ser Ala Leu Val Trp Glu Asp Leu Arg Asn Leu 
860 865 870 

TTG ATC TTC CTC TAC CAC CGC TTG ACA GAC TCA CTC TTG ATA CTG AGG 2304 
Leu He Phe Leu Tyr His Arg Leu Thr Asp Ser Leu Leu He Leu Arg 
875 880 885 890 

AGG. ACT CTG GAA CTC CTG GGA CAG AGT CTC AGC AGG GGA CTG CAA CTA 2352 
Arg Thr Leu Glu Leu Leu Gly Gin Ser Leu Ser Arg Gly Leu Gin Leu 
895 900 905 

CTG AAT GAA CTC AGA ACA CAC TTG TGG GGA ATA CTT GCA TAT TGG GGA 2400 
Leu Asn Glu Leu Arg Thr His Leu Trp Gly He Leu Ala Tyr Trp Gly 
910 915 920 

AAA GAG TTA AGG GAT AGT GCT ATC AGC TTG CTT AAT ACA ACA GCT ATT 2448 
Lys Glu Leu Arg Asp Ser Ala He Ser Leu Leu Asn Thr Thr Ala He 
925 930 935 

GTA GTA GCA GAA GGA ACA GAT AGG ATT ATA GAA TTA GCA CAA AGA ATA 2496 
Val Val Ala Glu Gly Thr Asp Arg He He Glu Leu Ala Gin Arg He 
940 945 950 

GGA AGG GGA ATA TTA CAC ATA CCT AGA AGA ATC AGA CAA GGC CTA GAA 2544 
Gly Arg Gly He Leu His He Pro Arg Arg He Arg Gin Gly Leu Glu 
955 960 965 970 

AGA GCA CTG ATA TAA 2559 
Arg Ala Leu He 



[ 
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(2) INFORMATIONS POUR LA SEQ ID NO: 18: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 852 acides amines 

(B) TYPE: acide amine 

<D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 18: 

Met Lys Val Met Gly Met Gin Ser Gly Trp Met Gly Met Lys Ser Gly 
15 10 15 

Trp Leu Leu Phe Tyr Leu Leu Val Ser Leu lie Lys Val lie Gly Ser 
20 25 30 

Glu Gin His Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Arg Glu 
35 40 45 

Ala Glu Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala His Ser Thr 
50 55 60 

Glu Ala His Asn lie Trp Ala Thr Gin Ala Cys Val Pro Thr Asp Pro 
65 70 75 80 

Asn Pro Gin Glu Val Leu Leu Pro Asn Val Thr Glu Lys Phe Asn Met 
85 90 95 

Trp Glu Asn Lys Met Ala Asp Gin Met Gin Glu Asp lie lie Ser Leu 
100 105 110 

Trp Glu Gin Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val 
115 120 125 

Thr Met Leu Cys Asn Asp Ser Tyr Gly Glu Glu Arg Asn Asn Thr Asn 
130 135 140 

Met Thr Thr Arg Glu Pro Asp lie Gly Tyr Lys Gin Met Lys Asn Cys 
145 150 155 160 

Ser Phe Asn Ala Thr Thr Glu Leu Thr Asp Lys Lys Lys Gin Val Tyr 
165 170 175 

Ser Leu Phe Tyr Val Glu Asp Val Val Pro lie Asn Ala Tyr Asn Lys 
180 185 190 

Thr Tyr Arg Leu lie Asn Cys Asn Thr Thr Ala Val Thr Gin Ala Cys 
195 200 205 

Pro Lys Thr Ser Phe Glu Pro He Pro He His Tyr Cys Ala Pro Pro 
210 215 220 

Gly Phe Ala He Met Lys Cys Asn Glu Gly Asn Phe Ser Gly Asn Gly 
225 230 235 240 

Ser Cys Thr Asn Val Ser Thr Val Gin Cys Thr His Gly He Lys Pro 
245 250 255 

Val He Ser Thr Gin Leu He Leu Asn Gly Ser Leu Asn Thr Asp Gly 
260 265 270 

He Val He Arg Asn Asp Ser His Ser Asn Leu Leu Val Gin Trp Asn 
275 280 285 

Glu Thr Val Pro He Asn Cys Thr Arg Pro Gly Asn Asn Thr Gly Gly 
290 295 300 
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Gin Val Gin lie Gly Pro Ala Met Thr Phe Tyr Asn lie Glu Lys lie 
305 310 315 320 

Val Gly Asp lie Arg Gin Ala Tyr Cys Asn Val Ser Lys Glu Leu Trp 
325 330 335 

Glu Pro Met Trp Asn Arg Thr Arg Glu Glu lie Lys Lys lie Leu Gly 
340 345 350 

Lys Asn Asn lie Thr Phe Arg Ala Arg Glu Arg Asn Glu Gly Asp Leu 
355 360 365 

Glu Val Thr His Leu Met Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys 
370 375 380 

Asn Thr Ser Lys Leu Phe Asn Glu Glu Leu Leu Asn Glu Thr Gly Glu 
385 390 395 400 

Pro lie Thr Leu Pro Cys Arg lie Arg Gin lie Val Asn Leu Trp Thr 
405 410 415 

Arg Val Gly Lys Gly lie Tyr Ala Pro Pro He Arg Gly Val Leu Asn 
420 425 430 

Cys Thr Ser Asn He Thr Gly Leu Val Leu Glu Tyr Ser Gly Gly Pro 
435 440 445 

Asp Thr Lys Glu Thr He Val Tyr Pro Ser Gly Gly Asn Met Val Asn 
450 455 460 

Leu Trp Arg Gin Glu Leu Tyr Lys Tyr Lys Val Val Ser He Glu Pro 
465 470 475 480 

He Gly Val Ala Pro Gly Lys Ala Lys Arg Arg Thr Val Ser Arg Glu 
485 490 495 

Lys Arg Ala Ala Phe Gly Leu Gly Ala Leu Phe Leu Gly Phe Leu Gly 
500 505 510 

Ala Ala Gly Ser Thr Met Gly Ala Ala Ser He Thr Leu Thr Val Gin 
515 520 525 

Ala Arg Thr Leu Leu Ser Gly He Val Gin Gin Gin Asn He Leu Leu 
530 535 540 

Arg Ala He Glu Ala Gin Gin His Leu Leu Gin Leu Ser He Trp Gly 
545 550 555 560 

He Lys Gin Leu Gin Ala Lys Val Leu Ala He Glu Arg Tyr Leu Arg 
565 570 575 

Asp Gin Gin He Leu Ser Leu Trp Gly Cys Ser Gly Lys Thr He Cys 
580 585 590 

Tyr Thr Thr Val Pro Trp Asn Glu Thr Trp Ser Asn Asn Thr Ser Tyr 
595 600 605 

Asp Thr He Trp Asn Asn Leu Thr Trp Gin Gin Trp Asp Glu Lys Val 
610 .615 620 

Arg Asn Tyr Ser Gly Val He Phe Gly Leu He Glu Gin Ala Gin Glu 
625 630 635 640 

Gin Gin Asn Thr Asn Glu Lys Ser Leu Leu Glu Leu Asp Gin Trp Asp 
645 650 655 
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Ser Leu Trp Ser Trp Phe Gly lie Thr Lys Trp Leu Trp Tyr lie Lys 
660 665 670 

He Ala He Met He Val Ala Gly He Val Gly He Arg He He Ser 
675 680 685 

He Val He Thr He He Ala Arg Val Arg Gin Gly Tyr Ser Pro Leu 
690 695 700 

Ser Leu Gin Thr Leu He Pro Thr Ala Arg Gly Pro Asp Arg Pro Glu 
705 710 715 720 

Glu Thr Glu Gly Gly Val Gly Glu Gin Asp Arg Gly Arg Ser Val Arg 
725 730 735 

Leu Val Ser Gly Phe Ser Ala Leu Val Trp Glu Asp Leu Arg Asn Leu 
740 745 750 

Leu He Phe Leu Tyr His Arg Leu Thr Asp Ser Leu Leu He Leu Arg 
755 760 765 

Arg Thr Leu Glu Leu Leu Gly Gin Ser Leu Ser Arg Gly Leu Gin Leu 
770 775 780 

Leu Asn Glu Leu Arg Thr His Leu Trp Gly He Leu Ala Tyr Trp Gly 
785 790 795 800 

Lys Glu Leu Arg Asp Ser Ala He Ser Leu Leu Asn Thr Thr Ala He 
805 810 815 

Val Val Ala Glu Gly Thr Asp Arg He He Glu Leu Ala Gin Arg He 
820 825 830 

Gly Arg Gly He Leu His He Pro Arg Arg He Arg Gin Gly Leu Glu 
835 840 845 

Arg Ala Leu He 
850 

(2) INFORMATIONS POUR LA SEQ ID NO: 19: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 639 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: siitrple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:!. .636 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19: 

ATG GGA AAG ATT TGG TCA AAG AGC AGC CTA GTA GGA TGG CCA GAA ATC 48 
Met Gly Lys He Trp Ser Lys Ser Ser Leu Val Gly Trp Pro Glu He 
855 860 865 

AGA GAA AGA ATG AGA AGA CAA ACG CAA GAA CCA GCA GTA GAG CCA GCA 96 
Arg Glu Arg Met Arg Arg Gin Thr Gin Glu Pro Ala Val Glu Pro Ala 
870 875 880 
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GTA GGA GCA GGA GCA GCT TCT CAA GAT CTA GCT AAT CGA GGG GCC ATC 
Val Gly Ala Gly Ala Ala Ser Gin Asp Leu Ala Asn Arg Gly Ala lie 
885 890 895 900 



144 



ACC ATA AGA AAT ACT AGA GAG AAT AAT GAA AGT ATA GCT TGG CTA GAA 
Thr lie Arg Asn Thr Arg Asp Asn Asn Glu Ser He Ala Trp Leu Glu 
905 910 915 



192 



GCA CAA GAA GAA GAA GAG GAA GTA GGC TTT CCA GTA CGC CCT CAG GTA 
Ala Gin Glu Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gin Val 
920 925 930 



240 



CCA TTA AGG CCA ATA ACC TAT AAA CAG GCT TTT GAT CTT TCC TTC TTT 
Pro Leu Arg Pro He Thr Tyr Lys Gin Ala Phe Asp Leu Ser Phe Phe 
935 940 945 



288 



TTA AAA GAT AAG GGG GGA CTG GAA GGG CTA GTT TGG TCC AGA AAA AGG 
Leu Lys Asp Lys Gly Gly Leu Glu Gly Leu Val Trp Ser Arg Lys Arg 
950 955 960 



336 



CAA GAT ATT CTA GAC CTC TGG ATG TAT CAC ACA CAA GGC ATC CTC CCT 
Gin Asp He Leu Asp Leu Trp Met Tyr His Thr Gin Gly He Leu Pro 
965 970 975 980 



384 



GAC TGG CAT AAC TAC ACA CCA GGG CCA GGA ATT AGA TAC CCC GTA ACC 
Asp Trp His Asn Tyr Thr Pro Gly Pro Gly He Arg Tyr Pro Val Thr 
985 990 995 



432 



TTT GGA TGG TGC TTC AAA CTA GTA CCA TTG TCA GCT GAA GAA GTA GAA 
Phe Gly Tro Cys Phe Lys Leu Val Pro Leu Ser Ala Glu Glu Val Glu 
1000 1005 1010 



480 



GAG GCT AAT GAA GGA GAC AAC AAT GCC CTC TTA CAC CCC ATA TGT CAA 
Glu Ala Asn Glu Gly Asp Asn Asn Ala Leu Leu His Pro He Cys Gin 
1015 1020 1025 



528 



CAT GGA GCA GAT GAT GAT CAT AAA GAA GTG TTG GTG TGG CGA TTT GAC 576 
His Gly Ala Asp Asp Asp His Lys Glu Val Leu Val Trp Arg Phe Asp 
1030 1035 1040 

AGC TCC CTA GCA AGA AGA CAT GTA GCA AGA GAG CTG CAT CCG GAG TTT 624 
Ser Ser Leu Ala Arg Arg His Val Ala Arg Glu Leu His Pro Glu Phe 
1045 1050 1055 1060 



TAC AAG AAC TGC TGA 
Tyr Lys Asn Cys 



639 



(2) INFORMATIONS POUR LA SEQ ID NO: 20: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 212 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 20: 

Met Gly Lys He Trp Ser Lys Ser Ser Leu Val Gly Trp Pro Glu He 
15 10 15 

Arg Glu Arg Met Arg Arg Gin Thr Gin Glu Pro Ala Val Glu Pro Ala 
20 25 30 
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Val Gly Ala Gly Ala Ala Ser Gin Asp Leu Ala Asn Arg Gly Ala lie 
35 40 45 

Thr lie Arg Asn Thr Arg Asp Asn Asn Glu Ser lie Ala Trp Leu Glu 
50 55 60 

Ala Gin Glu Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gin Val 
65 70 75 80 

Pro Leu Arg Pro lie Thr Tyr Lys Gin Ala Phe Asp Leu Ser Phe Phe 
85 90 95 

Leu Lys Asp Lys Gly Gly Leu Glu Gly Leu Val Trp Ser Arg Lys Arg 
100 105 110 

Gin Asp He Leu Asp Leu Trp Met Tyr His Thr Gin Gly He Leu Pro 
115 120 125 

Asp Trp His Asn Tyr Thr Pro Gly Pro Gly He Arg Tyr Pro Val Thr 
130 135 140 

Phe Gly Trp Cys Phe Lys Leu Val Pro Leu Ser Ala Glu Glu Val Glu 
145 150 155 160 

Glu Ala Asn Glu Gly Asp Asn Asn Ala Leu Leu His Pro He Cys Gin 
165 170 175 

His Gly Ala Asp Asp Asp His Lys Glu Val Leu Val Trp Arg Phe Asp 
180 185 190 

Ser Ser Leu Ala Arg Arg His Val Ala Arg Glu Leu His Pro Glu Phe 
195 200 205 

Tyr Lys Asn Cys 
210 

(2) INFORMATIONS POUR LA SEQ ID NO: 21: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE* 



<xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 21: 
ATTGCGTACT CACACTTCCG 20 
(2) INFORMATIONS POUR LA SEQ ID NO: 22: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 17 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 22 
GGCAAGCAGG GAGCTGG 

(2) INFORMATIONS POUR LA SEQ ID NO: 23: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: Unfair e 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 23 
TCCTTGAGCA GTCTGGAC 

(2) INFORMATIONS POUR LA SEQ ID NO: 24: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: sinple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = " AMORCE " 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 24 

GAACAGGAGG ATTAGCAG 

(2) INFORMATIONS POUR LA SEQ ID NO: 25: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 25 
AGCAGAGGCT ATGTCACA 

(2) INFORMATIONS POUR LA SEQ ID NO: 26: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE* 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 26 
TGTAAGGCCC CTAGAAGAG 
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(2) INFORMATIONS POUR LA SEQ ID NO: 27: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: siltiple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucl^ique 
(A) DESCRIPTION: /desc = " AMORCE " 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 27 
ACAGAGAACT CTCTGTAC 

(2) INFORMATIONS POUR LA SEQ ID NO: 28: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 28 
AAGAAAAGCA GTTGGT AC 

(2) INFORMATIONS POUR LA SEQ ID NO: 29: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 17 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: single 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 29 
TTTCTTCCCT GTATGTC 

(2) INFORMATIONS POUR LA SEQ ID NO: 30: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: single 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE; Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 30 

GTTATATGGA TTCTCAGG 
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(2) INFORMATIONS POUR LA SEQ ID NO: 31: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: sin^Jle 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 31 

TGGCAGCACA TTATACTGG 

(2) INFORMATIONS POUR LA SEQ ID NO: 32: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 23 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 32 
ATCATTTACC AGTACATGGA CGA 
(2) INFORMATIONS POUR LA SEQ ID NO: 33: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 33 

TGTCAGGGGT CGTAAAGC 

(2) INFORMATIONS POUR LA SEQ ID NO: 34: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 34 
TCCTCTGGAT GGGATATG 

(2) INFORMATIONS POUR LA SEQ ID NO: 35: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 18 paires de bases 
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(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 35 
TCTATCCAGG AATCAGAG 

(2) INFORMATIONS POUR LA SEQ ID NO: 36: 

(1) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 36 
AATGAGATCT GCCCATAC 

(2) INFORMATIONS POUR LA SEQ ID NO: 37: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

( D ) CONFIGURATION : 1 ineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = ■ AMORCE - 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 37 
TGACAGATAG GGGAAGAC 

(2) INFORMATIONS POUR LA SEQ ID NO: 38: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 38 

AACCGCCATT TGCACTGC 

(2) INFORMATIONS POUR LA SEQ ID NO: 39: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi> DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 39 
ACATGGACCG CCACAAGG 

(2) INFORMATIONS POUR LA SEQ ID NO: 40: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 40 

AGCAACAGAC ATACAGAC 

(2) INFORMATIONS POUR LA SEQ ID NO: 41: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = -AMORCE* 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 41 

AAAGTAGTCC CACGTAGG 

(2) INFORMATIONS POUR LA SEQ ID NO: 42: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: sin«>le 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 42 
ATATCCCAGT AGGTCAGG 

(2) INFORMATIONS POUR LA SEQ ID NO: 43: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 43 
TCTAGCACTA ACAGCCTG 

(2) INFORMATIONS POUR LA SEQ ID NO: 44: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 44 
ACTCTTACTG CTCTGAGG 

(2) INFORMATIONS POUR LA SEQ ID NO: 45; 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: siitqple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 45 
CCATAGTACA CTGTTACC 

(2) INFORMATIONS POUR LA SEQ ID NO: 46: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nuclei<iue 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 46 
CATAGCTATC GTTACAAAGC 

(2) INFORMATIONS POUR LA SEQ ID NO: 47: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: single 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 
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(xi) DESCRIPTION DE LA SEQUENCE; SEQ ID NO: 47 
TCATAATGGC AAAGCCTG 

(2) INFORjMATIONS POUR LA SEQ ID NO: 48: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
<A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 48 
CTATTCCACA TTGGTTCC 

(2) INFORMATIONS POUR LA SEQ ID NO: 49: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 49 
ATTCTAGAAC CAGTCCAG 

(2) INFORMATIONS POUR LA SEQ ID NO: 50: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 50 
CCTTAGGGAT CAGCAAATCC 

(2) INFORMATIONS POUR LA SEQ ID NO: 51: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: sin?)le 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 51 
TGGGACAGTC TGTGGAGC 

(2) INFORMATIONS POUR LA SEQ ID NO: 52: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE; Autre acide nucleiqfue 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 52 

TTCTCAGCTC TTGTCTGG 

(2) INFORMATIONS POUR LA SEQ ID NO: 53: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR; 18 paires de bases 

(B) TYPE: nucleotide 

<C) NOMBRE DE BRINS: simple 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE- 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 53 

ATTAAGCAAG CTGATAGC 

(2) INFORMATIONS POUR LA SEQ ID NO: 54: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE; nucleotide 

(C) NOMBRE DE BRINS: single 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = " AMORCE " 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 54 

TGTGCTTCTA GCCAAG 

(2) INFORMATIONS POUR LA SEQ ID NO: 55: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 55 

GCTCCATGTT GACATATG 
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(2) INFORMATIONS POUR LA SEQ ID NO: 56: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 56: 

AGAGAGACCC AGTACAAG 18 

(2) INFORMATIONS POUR LA SEQ ID NO: 57: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desC = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 57: 

ATAAAAGCAG CCGCTTCTCG 20 

(2) INFORMATIONS POUR LA SEQ ID NO: 58: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 35 acides amines 

(B) TYPE: acide amin^ 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 58: 

Cys Thr Arg Pro Gly Asn Asn Thr Gly Gly Gin Val Gin lie Gly Pro 
15 10 15 

Ala Met Thr Phe Tyr Asn lie Glu Lys lie Val Gly Asp lie Arg Gin 

20 25 30 ^ 

Ala Tyr Cys 
35 

(2) INFORMATIONS POUR LA SEQ ID NO: 59: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 35 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 59: 

Cys His Arg Pro Gly Asn Asn Thr Arg Gly Glu Val Gin lie Gly Pro 
15 10 15 
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Gly Met Thr Phe Tyr Asn lie Glu Asn Val Tyr Gly Asp Thr Arg Ser 
20 25 30 

Ala Tyr Cys 
35 

(2) INFORMATIONS POUR LA SEQ ID NO: 60: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 35 acides amines 

(B) TYPE: acide amin^ 

(C) NOMBRE DE BRINS: single 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 60: 

Cys lie Arg Pro Gly Asn Arg Thr Tyr Arg Asn Leu Gin lie Gly Pro 
15 10 15 

Gly Met Thr Phe Tyr Asn Val Glu lie Ala Thr Gly Asp lie Arg Lys 
20 25 30 

Ala Phe Cys 
35 

(2) INFORMATIONS POUR LA SEQ ID NO: 61: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 35 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 61: 

Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Val Arg lie Gly Pro 

15 10 15 

Gly Gin Ala Phe Tyr Ala Thr Gly Asp lie lie Gly Asp lie Arg Gin 
20 25 30 

Ala His Cys 
35 



wo 98/2(5075 PCT/FR97/02227 

62 No d« la demand* InUrn* 



MICRO«ORGANtSMES 

3 Q 



, lOiMTinCATIOM OU OtfrOT * 



Collection Nationale de Cultures de Microorganismes 



A4r«t»a nn«tftvtfofi 4» tf^P^t (j eomprtt >• cod* potW *t {• ^r«) * 

28 rue du Docteur Roux, 75724 PARIS CEDEX 15 



2 ]uillet 1996 



1-1753 



B. INOICATIOMS SUP Ptlltt MTAIHt* » (I »»• qi»« •< Ua« ImIW* •4p*r*m |aiAt» pour la •»#«• d« c«a 

raA«»l9it««n«Ai« Q 



"En ce qui concerne les designations dans lesquelles un 
brevet europ^en est demand^, un ^chantillon du micro- 
organisme d^pos^ ne sera accessible, jusqu'A la publication 
de la mention de la d61ivrance du brevet europeen ou 
jusqu'a la date A laquelle la demande sera rejet^e, retiree 
ou reput^e retiree, que par la remise d' un 6chantillon a un 
expert d6signe par le requ6rant . (r^gle 28.4) de la CBE)". 



C tTAT* OIIIONU POtjn UtOUf L« tit IMOICATIOMS iOMT OOMM<IS • (a* taa iftdkattwia a* teM »aa d<Min4at p 
tout (•« Cuia d4al«A«a) 



TOUS LES PAYS PARTIES AU PCT 



O, IMOICATIOM* rOURNIIS S<FAHllilllT » (ft »• rampdf qua M lUcaaaaifal 



L*a i«die.iton. «num4r«'tl ci.i»»»* ••^Mi «K*rtwif»m«M «w SutMu l«rtrr»aUo«al • (tpAeiflar la ftatwrp g4A«rml« da* i<»dl- 

canon* p. M., ffNo d'ord/* du d«»«i>> 



I. La pr*»«ni» f.u^Ut • *t* facua »»*c U damanda mi»riiation*t« lortqg. call».cl a M d4poa*a {ft »4Mft./ par ToAcp rftcaolauO 

(FoActlOAftalra aulorttA) 
Q Oau d« r4c*pUdA (pn pfo«aA«nca du dftp«aanO par I* Buraag IntprMdOAal *• 

(foActloAAairc autodaft) 



rermitlair* PCT/RO/134 Uanvtar IMt) 



wo 98/26075 



PCT/FR97/02227 



63 

REVENDICATIQNS 
1°) Souche de VTH-l non-M non-0, presentant les caracteristiques 
morphologiques et immunologiques du retrovirus deposes a la Collection Nationale de 
Cultures de Microorganismes tenue par Tlnstitut Pasteur sous le numero 1-1753 
5 (denomme YBF30) le 2 juiilet 1996. 

2°) Sequences d'acide nucleique, caracterisees en ce qu'elles sont 
issues de la souche selon la revendication 1 . 

3^) Sequence d'acide nucleique selon la revendication 2, caracterisee 
en ce qu'elle est selectionnee dans le groupe constitue par les sequences suivantes : la 
10 sequence nucleotidique complete de la souche selon la revendication 1 (SEQ ID N®1) 
ainsi que des fragments d'acide nucleique, issus de ladite souche : (SEQ ID N**2), 
(SEQ ID N^), (SEQ ID N°5), (SEQ ID N^7), (SEQ ID N^9), (SEQ ID N^ll), (SEQ 
ID N^13), (SEQ ID N°15X (SEQ ID N°17), (SEQ ID N°19) et les SEQ ID N^l-57, 
ainsi que toute sequence, qui n'est pas identique a Tune des sequences nucleotidiques 
15 ci-dessus ou n'est pas complementaire de Tune de ces sequences, mais est neanmoins 
susceptible de s'hybrider avec une sequence nucleique issue d*un virus VIH-1 non-M, 
non-0. 

4^) Oligonucleotide, caracterise en ce qu'il est selectionne parmi les 
sequences SEQ ID N°21 a 57 et en ce quMl est apte a servir d'amorce et/ou de sonde 
20 pour la detection d'un VIH-1 selon la revendication 1 ou la revendication 5. 

5°) VIH-1, caracterises en ce qu'ils sont distincts a la fois du groupe 
M et du groupe O et presentent les caracteristiques suivantes : 

* peu ou pas de reactivite serologique vis-a-vis des proteines des 
groupes M et O et forte reactivite serologique vis-a-vis des proteines issues de la 

25 souche YBF30 selon la revendication 1 ou de la souche SIV CPZGAB ; 

* absence d' amplification genomique a Faide des amorces des 
regions env et gag des VIH-1 des groupes M et 0 ; 

* amplification genomique en presence des amorces issues de la 
souche YBF30, selon la revendication 4 ; et 

30 * homologie des produits du gene d'enveloppe superieure a 70 % 

vis-a-vis de la souche YBF30. 
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6**) Precede de diagnostic in vitro d'un VIH-1 de groupe non-M non- 
O, par hybridation et/ou amplification genique, realise a partir d'un echantillon biolo- 
^que (serum ou lymphocyte circuiant), lequel precede est caracterise en ce qu'il 
comprend : 

5 . une etape d'extraction de Facide nucleique a detecter, appartenant 

au genome du virus, eventuellement present dans Techantillon biologique et, le cas 
echeant, une etape de traitement de Tacide nucleique, a Taide d*une transcriptase inver- 
se, si ce dernier est sous forme d'ARN, 

. au moins un cycle comprenant les etapes de denaturation de Tacide 

10 nucleique, d'hybridation avec au moins une sequence selon la revendication 3 ou la 
revendication 4 et eventuellement, si necessaire, extension de I'hybride forme, en 
presence de reactifs convenables (agent de polymerisation, tel qu'ADN polymerase et 
dNTP)et 

. une etape de detection de la presence eventuelle de Tacide 

15 nucleique appartenant au genome d'un virus de type VIH-1 de groupe non-M non-0. 

7^) Peptide, caracterise en ce qu'il est susceptible d'etre exprime par 
une souche de VIH-1 non-M non-0 selon la revendication 1 ou la revendication 5 ou a 
I'aide d'une sequence nucleotidique selon la revendication 3 et en ce qu*il est apte (1) a 
etre reconnu par des anticorps induits par un VTH-1 non-M non-0 selon la revendica- 

20 tion 1 ou la revendication 5 ou un variant de celui-ci et presents dans un echantillon 
biologique obtenu apres une infection par une souche de VIH-1 non-M non-0 et/ou (2) 
a induire la production d'anticorps anti- VIH-1 non-M non-0, 

8°) Peptide selon la revendication 7, caracterise en ce qu'il est choisi 
parmi celui exprime par le gene gag (SEQ ED N*" 4), celui exprime par le gene pol 

25 (SEQ ID W 6), celui exprime par le gene vif (SEQ ID N*" 8), celui exprime par le gene 
vpr (SEQ ID N** 10), celui exprime par le gene vpu (SEQ ID N° 12), celui exprime par 
le gene tat (SEQ ID N° 14), celui exprime par le gene rev (SEQ ID N"* 16), celui 
exprime par le gene env (SEQ ID N° 18) ou Tun de ses fi-agments, tels qu'un fi-agment 
de la region de la boucle V3 (SEQ ID 58) et celui exprime par le gene nef (SEQ ID 

30 N° 20) ou un fi-agment de ceux-ci aptes a reconnaitre les anticorps produits lors d'une 
infection par un VTH-l selon la revendication 1 ou la revendication 5. 
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9**) Compositions immunogenes comprenant un ou plusieurs produits 
de traduction des sequences nucleotidiques selon la revendication 3 et/ou I'un des pep- 
tides selon la revendication 7 ou la revendication 8. 

10°) Anticorps diriges contre Tun ou plusieurs des peptides selon la 
5 revendication 7 ou la revendication 8. 

11°) Methode de diagnostic in vitro d'un VIH-1 non-M non-0, 
caracterisee en ce qu'elle comprend la mise en contact d'un echantillon biologique 
preleve chez un patient, avec des anticorps selon la revendication 10, eventuellement 
associes a des anticorps anti-SIV CPZGAB et la detection des complexes inununo- 
10 logiques formes entre les antigenes de VIH-1, eventuellement presents dans 
Techantillon biologique et lesdits anticorps. 

12°) Reactif de diagnostic d'un VIH-1 non-M non-0, caracterise en 
ce qu'il comprend une sequence selon Tune quelconque des revendications 3, 4, 7 ou 
8. 

15 13°) Procede de criblage et de typage d'un VIH-1 non-M non-0, 

caracterise en ce qu'il comprend la mise en contact de Tun quelconque des fragments 
nucleotidiques selon la revendication 3 ou la revendication 4 avec Tacide nucleique du 
virus a typer et la detection de I'hybride forme. 

14°) Trousse de diagnostic de VIH-1 non-M non-0, caracterisee en 

20 ce qu'elle inclut au moins un reactif selon la revendication 12. 



wo 98/26075 PCr/FR97/02227 



1/20 



YLG 


nr 


A 


T 


T 


G 


C 


G 


T 


LPBS.1 


Itr 


G 


G 


G 


A 


A 


G 


C 


GAG Y 


ttr 


T 


G 


G 


T 


T 


G 


A 


AS1,1 


















GAG Y 


939 


G 


A 


A 


C 


A 


G 


G 


AS1 


















Gag 6 


9St9 


A 


G 


c 


A 


G 


A 


G 


GAG Y SI 


939 


T 


G 


T 


A 


A 


G 


G 


GAG Y 


939 


A 


C 


A 


G 


A 


G 


A 


S1.1 


















GAG Y 


939 


A 

A 


A 

A 


(3 


A 

A 


A 

A 


A 

A 


A 

A 


SI 2 
















YRTAS 


poi 


T 


T 


T 


c 


T 


T 


c 


1.3 


















YRTAS1.2 poi 


G 


T 


T 


A 


T 


A 


T 


YRTAS1.1 poi 


T 


G 


G 


C 


A 


G 


0 


YRT2 


poi 


A 


T 


C 


A 


T 


T 


T 


YRTAS1 


poi 


T 


G 


T 


C 


A 


G 


G 


YRT2-1 


poi 


T 


C 


C 


T 


c 


T 


G 


YRT2-2 


poi 


T 


c 


T 


A 


T 


G 


c 


YRT-3 


poi 


A 


A 


T 


G 


A 


G 


A 


YRT2-4 


poi 


T( 


G 


A 


C 


A 


G 


A 


4481-1 


poi 


A 


A 


C 


C 


G 


C 


C 


4481-2 


poi 


A 


C 


A 


T 


G 


G 




4235,1 


poi 


A 


G 


C 


A 


A 


C 


A 


4235.2 


vif 


A 


A 


A 


G 


T 


A 


G 


4235.3 


tat 


A 


T 


A 


T 


G 


C 


C 


4235.4 


tat 


T 


C 


T 


A 


G 


C 


A 


SK69.6 


env 


A 


C 


T 


G 


T 


T 


A 


SK69.5 


env 


C 


c 


A 


T 


A 


G 


T 


SK69.4 


env 


C 


A 


T 


A 


G 


0 


T 


SK69.3 


env 


T 


C 


A 


T 


A 


A 


T 


SK69.2 


env 


C 


T 


A 


T 


T 


C 


C 


SK69.1 


env 


A 


T 


T 


C 


T 


A 


G 


SK68,1 


env 


C 


C 


T 


T 


A 


G 


G 


SK68.2 


env 


T 


G 


G 


G 


A 


C 


A 


SK68.3 


env 


T 


T 


C 


T 


C 


A 


G 


LSI AS1.3 


net 


A 


T 


T 


A 


A 


G 


C 


LSIAS1.2 


nef 


T 


G 


T 


G 


C 


T 


T 


LSI AS 1.1 


nr 


G 


C 


T 


G 


C 


A 


T 


LSI A1 


Itr 


A 


G 


A 


G 


A 


G 


A 


YLPA 


Itr 


A 


T 


A 


A 


A 


A 


G 



ACTCACACTTCCG 

AGGGAGCTGG 

GCAGTCTGGAC 

AGGATTAGCAG 

GCTATGTCACA 

CCCCTAGAAQAG 

ACTCTCTGTAC 

GCAGTTGGT A-C 

CCTGTATGTC 

GGATTCTCAGG 
ACATTATACTGG 
ACCAGTACATGGACG 
GGTCGTAAAGC 

GATGGGATATG 
AGGAATCAGA G 

TCTGCCCATAC 

TAGGGGAAGAC 

ATTTGCACTGC 

CCGCCACAAGG 

GACATACAGAG 

TCCCACGTAGG 

AGTAGGTCAGG 

CTAACAGCCTG 

CTG CTCTGAGG 

ACACTGTTACC 

ATCGTTACAAA GC 

GGCAAAGCCTG 

ACATTGGTTCC 

AACGAGTCCAG 

GATCAGCAAATCC. 

GTCTGTGGAGC 

CTCTTGTCTGG 

AAGCTGATAGC 

CTAGCCAAG 

GTTGACATAT G 

CCCAGTACAAG 

CAGCCGCTTCT CG 



HGUREl 



wo 98/26075 



PCT/FR97y02227 




wo 98/26075 



PCT/FR97/02227 



3/20 



4 

I 

I 



(0 
(0 

>- 

O 
< 



(0 



CO 
Q. 

CQ 



CO 
CQ 
Q. 



wo 98/26075 



PCT/FR97/02227 



4/20 




wo 98/26075 



PCT/FR97/02227 



5/20 




wo 98/26075 



6/20 



PCT/FR97/02227 




wo 9806075 



7/20 



PCT/FR97/02227 




wo 98/26075 



PCT/FR97y02227 




wo 98/26075 



PCT/FR97/02227 



10/20 




wo 98/26075 



PCT/FR97y02227 



11/20 




wo 98/26075 



PCT/FR97/02227 



12/20 



< 




> 



wo 9806075 



PCT/FR97/0a227 



13/20 




wo 9806075 



PCT/FRy7/02227 



14/20 




o 

00 

Q. 



to 
o 



o 

t— . oo 



1 = 

a S 

> 
0) 



O 
CM 



ca 

"cr> U 

.5 

as 

m > 
CU nj 



1 

O 



C 
CO 



to 



o _ 
CO *: Q. a 



CI 
O 
H 



wo 9^26075 



PCr/FR97/a2227 




WO98A26075 



PCT/FR97/02227 



16/20 




wo 98/26075 



PCT/FRy7/02227 



17/20 




wo 98/26075 



18/20 



PCT/FRy7y02227 




wo 98^26075 



PCT/FR97/02227 




wo 98/26075 



PCT/FK97/02227 



20/20 



C/3 



o 

ro 

n 

d 
a 

a 

(U 
U 

a 

CO 

iS 

CJ 
O 



Nef 


34,6-39 


52,8-53 


33,7 


* 

Q 

Z 


o 

w a 
ac 


50-53 


73-74 


o 
m 


74,5 


Rev 


33,8-42 


80-88 


56,8 


ND* 






h> 






Tat 


22-27, 


46-47, 


27,8 


ir> 
in 


Vpu 


66,6-80 


>100 


>100 


>100 


Vpr 


27-30 


32-36 


28,8 


57,4 


Vif 


27,5-30 


42-45,6 


40,3 


57,1 


Pol 


22-24 


33-34 


26,8 


1-1 


Gag 


30-33 


37-38 


<N 

m 


in 






O 








HIV-1 


HIV-1 


CPZGi 





O 1 

o 



INTERNATIONAL SEARCH REPORT 



Inten. jnaJ Application No 

PCT/FR 



A. CLASSIFCAT10N0F»JBJECTMATTER , 

IPC 6 C12N15/49 C12N7/00 C12Q1/68 A61K39/21 C07K16/10 
C07K14/16 G01N33/50 



Accofdtng to International Patent Clas8ificalion(lPC) or to both national dassificaAion and IPC 



B. RELDS SEARCHED 

Minimum documentation searched (ctassiftcation system followed by classification symbols) 

IPC 6 C12N C07K 



Documentation searched other than minimum documentation to the eictent that such documents are included in the fields searched 



Bectronic data base consulted during the tntemauonal search (name of data base and, where practical, search terms used) 



C. DCX:UUENTS CONSIDERED TO BE RELEVANT 



Category • 


Citation of document, with tntfication. where appropriate, of tfie retevant passages 


Relevant to datm Nk>. 


X 


HUET, Z. ET AL.: "A highly defective 


3 




HIV-1 strain isolated from a healthy 






Gabonese individual presenting an atypical 






Western blot" 






AIDS, 






vol. 3, no. 11, November 1989, 






pages 707-715, XP002041193 






see figure 3 




X 


WO 86 02383 A (PASTEUR INSTITUT ; CENTRE 


3 




NAT RECH SCIENT (FR)) 24 April 1986 






see figure 4 






-/- 





m 



Further documents are listed in the continuation of box C. 



|)( [ Patent family members are listed in annex. 



* Spectat categories of cited documents : 

*A' document defining the general stale of the art which is not 

considered to be of particular retevanoe 
*E* earlier document t>ut published on or after the international 

filing date 

*L* document which may threw doubts on priority daimfs) or 
which is cited to establish the publication date of another 
citation or other special reason (as specified) 

'O* document referring to an oral disclosure, use. exhibition or 
other means 

'P* document published prior to the international fiBng date but 
later than the prioHty date claimed 



1' later document publrshed after the international filing date 
or priority date and not in conflict with the appltcatton but 
cited to understand the principle or theory underfying the 
invention 

'X* document of particular relevance; the claimed invention 
cannot be considered novel or cannot be considered to 
tnvohre an inventive step when tfie document is taken alone 

"Y* document of particular relevance; the claimed inventbn 

cannot be considered to involve an inventive step when the 
documertt is combined with one or more other such docu- 
ments, such combination being obvious to a person skHled 
in the art. 

document nr»ember of the same patent family 



Date of the actual completion of thelntemational search 

14 April 1998 


Dale of mailing of the intematiortal search report 

21/04/1998 


Name and mailing address of the ISA 

European Patent Office. P.B. 5818 Patentlaan 2 
NL-2280HVRiiswlik 
Tel. (431-70) 340-2040. Tx. 31 651 epo nl. 
Fax: (431-70) 340-3016 


Authorized officer 

Chafnbonnet, F 



Form PCTASA/ZI 0 (sttoond sheet) (Juty 1 992) 



page 1 of 2 



INTERNATIONAL SEARCH REPORT 



Inten jnal Application No 

PCT/FR 97/mZl 



C^Continuatton) DOCUMENTS CONSIDERED TO BE RELEVANT 


Categofy " 


Citation of document, with indication.wherB appropriate, of the relevant passages 


Relevant to daim No. 



HUET T ET AL: "GENETIC ORGANIZATION OF A 
CHIMPANZEE LENTIVIRUS RELATED TO HIV-l" 
NATURE, 

vol. 345, no. 6273, 24 May 1990, 
pages 356-359, XP000172750 
see the whole document 

TOJO, N. ET AL.: "Cloning and nucleotide 
sequence of the Myxococcus xanthus Ion 
gene: indispensability of Ion for 
vegetative growth" 
JOURNAL OF BACTERIOLOGY, 
vol. 175, no. 8, April 1993, 
pages 2271-2277, XP002041194 
see figure 3 

INAGAKI, N. ET AL.: "Cloning and 
functional characterization of a third 
pituitary adenylate cyclase-activating 
polypeptide receptor subtype expressed in 
insulin-secreting cells" 
PROCEEDINGS OF THE NATIONAL ACADEMY OF 
SCIENCES OF USA. , 

vol. 91, March 1994, WASHINGTON US, 
pages 2679-2683, XP002041195 
see the whole document 



1 



Form PCT/ISA/210 (oontlnuabon ol sscotid sheet) (July 1992) 



page 2 of 2 



INTERNATIONAL SEARCH REPORT 

Information on patent famity members 



Intent .onal Application No 

PCT/FR 97/02227 



Patent document 
cited in search report 


Publication 
date 


Patent family 
memt)er(s) 


Publication 
date 


WO 8602383 A 


24-04-86 


FR 


2571968 


A 


25-04-86 




AU 


603543 


B 


22-11-90 




AU 


5061785 


A 


02-05-86 




DE 


3587181 


A 


15-04-93 




DE 


3587512 


A 


09-09-93 




DE 


3587512 


T 


02-12-93 




DK 


35593 


A 


26-03-93 




DK 


284986 


A 


14-08-86 




EP 


0201540 


A 


20-11-86 




EP 


0387914 


A 


19-09-90 




EP 


0387915 


A 


19-09-90 




EP 


0462627 


A 


27-12-91 




IE 


64006 


B 


28-06-95 




JP 


9132594 


A 


20-05-97 




JP 


9118689 


A 


06-05-97 




JP 


9178751 


A 


11-07-97 




JP 


7309779 


A 


28-11-95 




JP 


2609448 


B 


14-05-97 




JP 


62500592 


T 


12-03-87 




NZ 


230372 


A 


25-02-94 




US 


5705612 


A 


06-01-98 

WW WA 








A 


11-03-97 




AU 


600227 


B 


09-08-90 

W ^ WW ^ w 




AU 


5320086 


A 


13-08-86 




DK 


168667 


B 


16-05-94 




WO 


8604336 


A 


31-07-86 




EP 


0211022 


A 


25-02-87 




JP 


62502095 


T 


20-08-87 




KR 


9508570 


B 


03-08-95 




OA 


8413 


A 


30-06-88 



Forni PCT/ISAfil 0 (patent tamly annex) (July 1992) 



RAPPORT DE RECHERCHE INTERNATIONALE 



Denu i IntBmattonalo No 

PCT/FR 97/02227 



A. CLASSEMENT DE L-OBJET DE LA OEMANOE 

CIB 6 C12N15/49 C12N7/00 C12Q1/68 A61K39/21 C07K16/10 
C07K14/16 G01N33/50 

Soton la classification intemationale des brevets (CIB) ou A la fote seten to dassification natioraJe et la CiB 



B. DOMAINESSURLESQUELS LA RECHERCHE A PORTE 



Documentation mtnimale coRsult6e(syst6m8 de classification suivi des symboles de classement) 

CIB 6 C12N C07K 



Documentation consultee autre que la documentation minimale dans la mesureoO ces documents reinvent des domaines sur lesquels a porte la recherche 



Base de donnees electronique consuttto au cours de la recherche intemationale (nom de ta base de donnees. et si celaest realisable, temies de recherche 
utitiste) 



C. DCX:UMENTS CONSIDERES COMME PERTINEffTS 



Catdgorie' 


IdenUfication des docmnents citds. avec.le cas echeant. Hndicationdes passages pertinents 


no. des reverKficattons mees 


X 


HUET, Z. ET AL.: "A highly defective 


3 




HIV-1 strain isolated from a healthy 






Gabonese individual presenting an atypical 






Western blot" 






AIDS, 






vol. 3, no. 11, novembre 1989, 






pages 707-715, XP002041193 






voir figure 3 




X 


WO 86 02383 A (PASTEUR INSTITUT ;CENTRE 


3 




NAT RECH SCIENT (FR)) 24 avril 1986 






voir figure 4 






-/- 





Voir la suite du cadre C pour la fin de la liste des documents 



ID 



Les documents de families de t>revet& soni indiquesen annexe 



* Categories spedales de documents dtds: 

*A' document ddfintssant r6tat Q6n6ral da tatechnique. non 

considere cxxnme particutierement pertinent 
'P document anterieur. mais public & la date ded6p6t international 

ou apres oette date 

'L' document pouvant feter un doute sur une revendcation de 
priority ou dtd pour d^temntner la date depubticalion d'une 
autre dtation ou pour une raison specials aelle qu'lndiquee) 

'CT document se rAfAmrd k une divulgation orale. a un usage, k 
une exposition ou tous autres moyens 

'P' document pubfid avant la date de ddpdtintemational. mais 
posterieurement k la date da pnorite revendiquee 



T document uttdrieur puttlie aprte ladate de ddp6t international ou la 
date de priority et n'appartenenant pas d de la 
technique pertinent, mais dtepour comprendre le prrnctpe 
ou la th6orte oonstthjant :a base derinvention 

'X" document paitlcuBdrement pertinent; finventton revendiqute ne peut 
3tre considdree comme rKMivelle ou comme impliquant une activtte 
inventive par rapport au document considdrd isol6ment 

•Y" document particuBferement pertinent; rinvention revendiqu6e 
ne peut 6tie consider^ oomme impliquant une activity inventive 
loisque le docurrtent estassodd a un ou ptusteurs autres 
documents de m§me nature, cette combtnaison etant dvidente 
pour une personne du metier 

'&* docuntent qui fait partie de la m6me lamtUede brevets 



Date & taquelle la recherche intemationale a 6t6effectivement achevee 

14 avril 1998 


Date d'expe<fition du present rapport de recherche intemationale 

21/04/1998 


Nom et adresse postale de I'administrattonchargte de ta recherche imemattonale 
Office Europeen des Brevets. P.B. 581 B Patentlaan 2 
NL-22B0HV Ritswijk 
Tel. (+31-70) 3405040. Tx. 31 651 epo nl. 
Fax: (431-70) 340-3016 


Fonctionnaire autorisa 

Chambonnet, F 



fk»inulalre PCTASA/ZIO (dBUXttow teuille) OuillOt 1992) 



page 1 de 2 



RAPPORT DE RECHERCHE INTERNATIONALE 



Denk i Internationale No 

PCT/FR 97/02227 



a(sutte) DOCUMENTS CONSIDERESCOMME PERTINENTS 

Cat6goHe ' Identification des documents dtte, avec> cas 6chtont, rindlcatlondes passages pertinents no. des revendications vtebes 



X HUET T ET AL: "GENETIC ORGANIZATION OF A 3 

CHIMPANZEE LENTIVIRUS RELATED TO HIV-l" 
NATURE, 

vol. 345, no. 6273, 24 mai 1990, 
pages 356-359. XP000172750 
voir le document en entier 

X TOJO, N. ETAL.: "Cloning and nucleotide 3 

sequence of the Myxococcus xanthus 1on 
gene: indispensability of Ion for 
vegetative growth" 
JOURNAL OF BACTERIOLOGY, 
vol. 175, no. 8, avril 1993, 
pages 2271-2277, XP002041194 
voir figure 3 

X INAGAKI, N. ET AL.: "Cloning and 3 

functional characterization of a third ^ 
pituitary adenylate cyclase-activating 
polypeptide receptor subtype expressed in 
insulin-secreting cells" 
PROCEEDINGS OF THE NATIONAL ACADEMY OF 
SCIENCES OF USA. , 

vol. 91, mars 1994, WASHINGTON US, 
pages 2679-2683, XP002041195 
voir le document en entier 



1 



Rmnulaira PCT/ISA/210 (sirils de ta ctouxlAim teulle) OuDkit 1902) 



page 2 de 2 



RAPPORT DE RECHERCHE INTERNATIONALE 

nenselgneroents relatrfs nix membresde fammes de brevete 



Denu. .e Internationale No 

PCT/FR 97/02227 



Document brevet cit6 
au rapport de recfierdie 



Oatede 
publication 



Membie(s)dela 
tamille de brevet(s) 



Dale de 
publication 



UO 8602383 A 



24-04-86 



FR 
AU 
AU 
DE 
DE 
DE 
DK 
DK 
EP 
EP 
EP 
EP 
IE 
JP 
JP 
JP 
JP 
JP 



2571968 A 
603543 B 
5061785 
3587181 
3587512 
3587512 

35593 
284986 
0201540 
0387914 
0387915 
0462627 

64006 B 
9132594 A 
9118689 A 
9178751 A 
7309779 A 
2609448 B 



A 
A 
A 
T 
A 
A 
A 
A 
A 
A 



JP 62500592 



NZ 
US 
US 
AU 
AU 
DK 
WO 
EP 



230372 
5705612 
5610035 

600227 
5320086 

168667 B 
8604336 A 
0211022 A 



JP 62502095 



KR 
OA 



9508570 B 
8413 A 



25- 04-86 
22-11-90 
02-05-86 

15- 04-93 
09-09-93 

02- 12-93 

26- 03-93 
14-08-86 
20-11-86 
19-09-90 

19- 09-90 

27- 12-91 

28- 06-95 

20- 05-97 
06-05-97 

11- 07-97 
28-11-95 
14-05-97 

12- 03-87 
25-02-94 
06-01-98 
11-03-97 
09-08-90 

13- 08-86 

16- 05-94 
31-07-86 
25-02-87 
20-08-87 

03- 08-95 
30-06-88 



Foimutaira PCT/tSA/210 (aimexo famiirft* de bfm«l») QuBlet 1992) 



This Page is Inserted by IFW Indexing and Scanning 
Operations and is not part of the Official Record 



Defective images within this document are accurate representations of the original 
documents submitted by the appHcant. 

Defects in the images include but are not limited to the items checked: 

□ BLACK BORDERS 

□ IMAGE CUT OFF AT TOP, BOTTOM OR SIDES 

□ FADED TEXT OR DRAWING 

□ BLURRED OR ILLEGIBLE TEXT OR DRAWING 

□ SKEWED/SLANTED IMAGES 

□ COLOR OR BLACK AND WHITE PHOTOGRAPHS 

□ GRAY SCALE DOCUMENTS 



llJ LINES OR MARKS ON ORIGINAL DOCUMENT 

□ REFERENCE(S) OR EXHIBIT(S) SUBMITTED ARE POOR QUALITY 

□ OTHER: ' 

IMAGES ARE BEST AVAILABLE COPY. 
As rescanning these documents will not correct the image 
problems checked, please do not report these problems to 
the IFW Image Problem Mailbox. 



BEST AVAILABLE IMAGES 




